Guía Data Science – Parte 1
¿Te planteaste objetivos al inicio de este año? ¿Hacer más ejercicio, comer mejor, aprender a tocar un instrumento o adquirir una nueva habilidad? Si convertirte en un Data Scientist estaba en tu lista, ¡has llegado al lugar indicado! En este blog recopilamos los mejores cursos gratis y en español para que, al final de 2023, seas un Data Scientist.
Todos los recursos los encontramos directamente en Google, pues la habilidad de “googlear” es la más importante en la industria TI.
La idea del blog surge de recrear en español lo hecho por http://datasciencemasters.org/: una curricula open source para lograr un entry level de data science de forma gratuita. Al igual que ellos, separaremos las habilidades en cuatro categorías, las cuales las presentaremos en tres blogs.
El primer paso será trabajar en esas habilidades que son la base del conocimiento de un data scientist, pero la primer pregunta evidente mente debe ser que es la ciencia de datos.
¿Qué es la ciencia de datos?
1 – Qué es Data Science | Universidad Complutense de Madrid
2 – Data Sciene: ¿de qué estamos hablando?
3 – 15 casos de éxito de Big Data en el mundo
¿Qué hace un data scientist?
Existen tres pilares fundamentales en la ciencia de datos: programación, estadística y habilidades de negocio. Aunque es prácticamente imposible dominarlos todos, hay una base común deseada en cada uno. Aquí encontrarás recursos para crear una buena base en programación y estadística, las habilidades de negocio, sin embargo, dependerán de la industria.
Matemática/Estadística
Probabilidad y Estadística:
Cursos:
Matemáticas para Cs. de Datos y Aprendizaje Automático
Estadística avanzada (AP Statistics)
Libro:
Introducción a la estadística empresarial
Aplicaciones en python de conceptos estadísticos:
Álgebra lineal:
Programación
Base de Datos
En bases de datos, la clasificación más común suele ser la de bases de datos estructuradas y no estructuradas, esta clasificación viene del nombre del lenguaje más popular, SQL. Este significa Structured Query Language o lenguaje de consulta estructurada, este es por lejos el lenguaje más utilizado en bases de datos, como complemento añadimos un curso sobre una de las alternativas a SQL más utilizadas.
Cursos SQL:
Bases de Datos para la Gestión
Cursos NoSQL
MongoDB Curso, Introducción Practica a NoSQL
Python
Python es un lenguaje de programación de proposito general, es decir que puede ser utilizado en diversas aplicaciones como creación de programas, paginas web o el proposito que nos interesa, la ciencia de datos, los cursos que listaremos en este apartado será para conocer las basicas del lenguaje, las estructuras de datos y como definir funciones, en un segundo apartado veremos como utilizar el lenguaje y sus librerias especializadas en ciencia de datos.
Podés elegir el instructor que más te guste su forma de enseñar:
Curso de PYTHON desde CERO (Completo)
Curso Programacion Python – De Cero a Heroe
Aprende Python – Curso de Python desde Cero
Libro:
Python For Everyone es un clásico de python, escrito por Charles Severance, docente de la Universidad de Michigan, por suerte este libro fue traducido al español. (link al libro)
Sus clases basadas en su propio libro pueden verse subtituladas, aunque claramente va en contra de lo que queremos lograr con este blog.
Introducción a Python para Ciencias de datos
Tanto el curso como el libro retomarán conceptos que se vieron en el apartado de Python, esta vez aplicándolos al manejo y modelado con datos.
Cursos:
Curso Gratuito de Python para el Tratamiento de Datos
Blog:
Libro:
Manual de Python – Focalizarse en Módulos, Datetime, Numpy, Pandas y Matplotlib
En el siguiente blog veremos cuales son los conceptos básicos que debe manejar un data scientist, y que ramas existen para especializarse dentro de la ciencias de datos.