La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos. El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores. Los alumnos aprenderán técnicas de análisis exploratorio de datos, validación de hipótesis y regresión, entre otros temas.
Dirigido a:
- Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
- Todas las personas que han aprendido lo esencial de Data Mining, pero necesitan profundizar y adquirir algo de fundamentos estadísticos.
Objetivo de aprendizaje:
- Analizar datos de forma exploratoria para explicar la correlación entre variables, aplicando conceptos estadísticos.
- Variables y transformaciones
- Dataframes
- Histogramas y su interpretación
- Distribuciones
- Varianza y efecto del tamaño
- Funciones de probabilidad
- PMFs y sus gráficas
- Distribuciones discretas
- Distribuciones continuas
- Familia exponencial
- Familia normal
- Funciones de distribución acumulada (CDFs)
- Distribución exponencial y distribución normal
- Gráficas y distribución lognormal
- Diagramas de dispersión
- Correlación
- Covarianza
- Correlación, correlación de Pearson y causalidad
- Testeo de hipótesis
- Diferencia de medias
- Testeo de correlación y testeo de proporciones
- Mínimos cuadrados lineales
- Regresión y predicciones
- Análisis de series de tiempo