Guía Data Science – Parte 3
En este último post de la trilogía veremos cómo llevar adelante un proyecto de Data Science. Para esto veremos varias entrevistas o conferencias donde diversos Data Scientist nos cuentan su experiencia en el sector, un segundo apartado para entender el carácter ético de la disciplina, y un tercer apartado que nos de herramientas para entender los diversos roles que existen, como redactar documentos y comunicar nuestros hallazgos.
Al final del blog encontraras links a diversas fuentes estatales de datos que te permitirán generar tus propios proyectos.
En la práctica
¿Qué es el trabajo? ¿A qué se enfrenta un Data Scientist?
Videos:
Eduardo Graells‐Garrido: “Cómo ser Data Scientist y no morir en el intento” | Starsconf 2017
Eduardo Graells: “Data Science en Chile” | Starsconf 2018
Qué es REALMENTE la Ciencia de Datos en 2023? Contado por un Data Scientist👨🏻💻
Tipos de proyectos en Data Science
Los 4 Perfiles Profesionales en Data Science y Big Data. Conoce cual eres tú
💾 ¿CÓMO Trabajar con DATA? – Ciencia de Datos: ETL, BI, ML, Data Analytics
Artículos:
¿Qué es el Proceso de ciencia de datos en equipo (TDSP)?
Ética de Datos
Intro
Ética práctica para ciencia de datos
Comunicación
Trabajo en equipo:
La importancia de la comunicación en Data Science y cómo mejorarla
Redacción de documentos:
El siguiente apartado fue traducido de http://datasciencemasters.org/
El documento debe transmitir los motivos, la dirección, la inversión y el valor esperado del trabajo.
- Objetivo / “Por qué” – ¿Cuál es el objetivo de este trabajo? ¿Qué decisión pretende tomar la organización?
- Impacto – ¿Qué decisiones podrían tomarse de forma diferente como resultado de este trabajo? ¿Cuál es el valor esperado?
- Datos: ¿en qué pruebas se basará el trabajo?
- Suposiciones – ¿Qué pruebas no existen? ¿Qué supuestos son necesarios o se han acordado?
- Métodos / “Cómo” – Métodos generales que se prevé utilizar. Análisis, ¿con qué herramientas? Experimentación, ¿con qué metodología?
- Resultados – (a rellenar a medida que se vayan completando)
Narración con datos:
S10-Clase 20: Introducción a la Visualización de Datos y Storytelling con Datos
¿Qué es la narración de datos o data storytelling?
Presentación de resultados:
Guía: Cómo hacer una buena presentación de resultados y no morir en el intento
Proyectos
Una guía paso a paso para crear un portafolio de proyectos de Data Science
Casi todos los países tiene su portal de catalogo de datos abiertos, en estos links podras encontrar varias bases de datos en las cuales basar tus proyectos.
Catálogo de Datos Abiertos – Uruguay
Plataforma Nacional de Datos Abiertos – Perú
Datos Abiertos del Gobierno de España
También podes optar con proyectos los cuales tengas el dataset y el código de como fue resuelto para ayudarte, lamentablemente no encontré una version en español, aunque tendrás los dataset y podrás intentar replicar sus resultados o hallar tus propios resultados:
290+ Machine Learning Projects with Python