Guía Data Science – Parte 3

En este último post de la trilogía veremos cómo llevar adelante un proyecto de Data Science. Para esto veremos varias entrevistas o conferencias donde diversos Data Scientist nos cuentan su experiencia en el sector, un segundo apartado para entender el carácter ético de la disciplina, y un tercer apartado que nos de herramientas para entender los diversos roles que existen, como redactar documentos y comunicar nuestros hallazgos.

Al final del blog encontraras links a diversas fuentes estatales de datos que te permitirán generar tus propios proyectos.

En la práctica

Captura obtenida de https://www.youtube.com/watch?v=OvOByKR2VGI

¿Qué es el trabajo? ¿A qué se enfrenta un Data Scientist?

Videos:

Eduardo Graells‐Garrido: “Cómo ser Data Scientist y no morir en el intento” | Starsconf 2017

Eduardo Graells: “Data Science en Chile” | Starsconf 2018

Qué es REALMENTE la Ciencia de Datos en 2023? Contado por un Data Scientist👨🏻‍💻

¿Qué hace un Data Scientist?

Tipos de proyectos en Data Science

Los 4 Perfiles Profesionales en Data Science y Big Data. Conoce cual eres tú

💾 ¿CÓMO Trabajar con DATA? – Ciencia de Datos: ETL, BI, ML, Data Analytics

Artículos:

¿Qué es el Proceso de ciencia de datos en equipo (TDSP)?

Ética de Datos

Intro

Ethical Machine Learning

Ética práctica para ciencia de datos

Comunicación

Trabajo en equipo:

La importancia de la comunicación en Data Science y cómo mejorarla

Redacción de documentos:

El siguiente apartado fue traducido de http://datasciencemasters.org/
El documento debe transmitir los motivos, la dirección, la inversión y el valor esperado del trabajo.

  • Objetivo / “Por qué” – ¿Cuál es el objetivo de este trabajo? ¿Qué decisión pretende tomar la organización?
  • Impacto – ¿Qué decisiones podrían tomarse de forma diferente como resultado de este trabajo? ¿Cuál es el valor esperado?
  • Datos: ¿en qué pruebas se basará el trabajo?
  • Suposiciones – ¿Qué pruebas no existen? ¿Qué supuestos son necesarios o se han acordado?
  • Métodos / “Cómo” – Métodos generales que se prevé utilizar. Análisis, ¿con qué herramientas? Experimentación, ¿con qué metodología?
  • Resultados – (a rellenar a medida que se vayan completando)

Narración con datos:

S10-Clase 20: Introducción a la Visualización de Datos y Storytelling con Datos

Data Storytelling

¿Qué es la narración de datos o data storytelling?

Presentación de resultados:

Guía: Cómo hacer una buena presentación de resultados y no morir en el intento

Proyectos

Una guía paso a paso para crear un portafolio de proyectos de Data Science

Casi todos los países tiene su portal de catalogo de datos abiertos, en estos links podras encontrar varias bases de datos en las cuales basar tus proyectos.

Datos Argentina

Catálogo de Datos Abiertos – Uruguay

Plataforma Nacional de Datos Abiertos – Perú

Datos Abiertos de Colombia

Datos Abiertos de México

Datos Abiertos del Gobierno de España

También podes optar con proyectos los cuales tengas el dataset y el código de como fue resuelto para ayudarte, lamentablemente no encontré una version en español, aunque tendrás los dataset y podrás intentar replicar sus resultados o hallar tus propios resultados:

290+ Machine Learning Projects with Python

Pablo Molina
Consultor Data & Analytics