Diplomado en Minería de datos (online)
Este programa ofrece un conjunto de herramientas de la disciplina Data Mining, lo que te permitirá dominar el análisis de datos y la predicción de comportamientos para tomar mejores decisiones en la organización.
Comenzarás con los fundamentos estadísticos y las competencias de programación esenciales, avanzando hacia técnicas y aplicaciones prácticas.
Lo mejor de todo es que no necesitas conocimientos previos en programación o estadística. Nuestro diplomado está diseñado para ser accesible tanto a profesionales técnicos, como a todo tipo de profesionales.
Antecedentes Generales
Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.
El Diplomado en Minería de datos se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de minería de datos permiten llegar a un nivel de profundidad más alto.
La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.
Todas las personas interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
Todas las personas que han aprendido lo esencial de Data Mining, pero necesitan profundizar y adquirir fundamentos estadísticos.
Utilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.
Se recomienda contar con:
– Licenciatura, título profesional o técnico de mínimo cuatro años.
– Conocimientos básicos de programación en Phyton.
– Conocimientos de minería de datos o aprendizaje de máquina.
– Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
– Dos años de experiencia laboral.
Contenidos del Programa
Al final del curso podrás:
– Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
– Utilizar los comandos de control de flujo y los ciclos para la dirigir y repetir eficientemente un conjunto de operaciones básicas.
– Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos.
– Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
– Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.
Contenidos:
Introducción a la programación: Motivación: de los datos a la información, datos, información y programación ¿cómo conviven hoy estos elementos en el mundo laboral?, ¿qué es la programación?, aplicaciones prácticas, la programación en el mundo laboral y cómo debe convertirse en un hábito. Secuencias de comandos en Python. Operaciones básicas. Creación y asignación de variables. Operaciones lógicas.
Control de flujo: Control de flujo: If, Else, Elif, uso en conjunto. Ciclos: While, For.
Tipos de datos y funciones: Tipos de datos: enteros, decimales, textos y listas. Strings: ¿qué es un string?, funciones básicas y avanzadas de un string. Funciones: ¿qué es una función?, ¿por qué ocupar funciones?, declaración y uso de funciones. Listas: creación de listas, obtener elementos, añadir elementos o quitar elementos, operaciones sobre listas.
Procesamiento de datos: Listas de listas. Archivos: cómo se interactúa con archivos y para qué sirven, leer y escribir archivos. Procesamiento de datos: carga y edición masiva, ejemplos prácticos.
Diccionarios y tuplas: Listas y listas de listas. Manipulación de listas. Funciones sobre listas. Diccionarios. Operaciones y aplicaciones de diccionarios. Aplicaciones con listas y diccionarios. Tuplas como tipo de dato inmutable. Operaciones sobre tuplas. Combinando listas, tuplas y diccionarios.
Funciones: Concepto de función. Definición de funciones. Parámetros y valores de retorno. Importación y llamado de módulos. Invocación de funciones y scope. Parámetros con nombre y parámetros por defecto. Funciones recursivas. Aplicación de funciones.
Al finalizar el curso podrás:
– Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
– Mostrar en forma gráfica distribuciones empíricas de los datos.
– Modelar un problema en base a distribuciones analíticas conocidas.
– Analizar la interrelación entre dos o más variables.
– Evaluar la validez de una hipótesis en base a los datos.
Contenidos:
Análisis exploratorio de datos e introducción a las distribuciones
– Variables y transformaciones.
Distribuciones y funciones de probabilidad
– Variables y efecto del tamaño. Funciones de probabilidad (PMFs).
Funciones de probabilidad
– Distribuciones continuas. Familia exponencial. Funciones de distribución acumulada (CDFs).
Modelación de distribuciones e introducción a las relaciones entre variables
– Distribuciones continuas. Gráficas distribución lognormal. Diagramas de dispersión. Correlación.
Relación entre variables, correlación y una introducción al testeo de hipótesis
– Covarianza. Testeo de hipótesis. Diferencia de medias. Formalización.
Testeo de hipótesis, regresión e introducción a las series de tiempo
– Testeo de correlación y testeo de proporciones. Mínimos cuadrados lineales. Introducción a las series de tiempo.
Al finalizar el curso podrás:
– Identificar las principales teorías y prácticas de la Minería de Datos.
– Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones.
– Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales.
Contenidos:
Conceptos sobre Data Warehouse y uso de Dataframes
Procesamiento y consolidación de datos
– Preprocesamiento de datos. Selección y transformación de datos.
Reglas de asociación
Aplicación de los algoritmos Random Forest y KNN
– Árbol de decisión. KNN. Random Forest.
Aplicación de los algoritmos K-Means y DBSCAN
– Clustering. K-Means. Clustering jerárquico.
Introducción al Machine Learning
– Modelo de entrenamiento. Métricas de evaluación.
Al finalizar el curso podrás:
– Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones.
– Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
– Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos.
– Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.
Contenidos:
Series de tiempo
– Series de tiempo: análisis visual, componentes, estacionariedad y tipos de modelos.
– Tratamiento de una serie de tiempo no estacionaria.
– Modelos MA.
Minería de texto y web scraping
– Minería de texto. Web scraping.
Aprendizaje por refuerzo
– Aprendizaje por refuerzo. Métodos de Monte Carlo.
Q-Learning
– Funciones de valor. Q-Learning.
Redes neuronales artificiales
– Estructura de una red neuronal artificial. Entrenamiento de redes neuronales artificiales. Otros tipos de redes neuronales.
Nuevas tendencias de machine learning
– Modelos fundacionales. Inteligencia artificial generativa.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Mauricio Arriagada
Doctor en Ciencias de la Ingeniería UC
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Nicolás Alvarado Monárdez
Profesor Instructor Adjunto del Departamento de Ciencia de la Computación UC
Sebastián Raveau
Profesor Asistente de Ingeniería de Transporte y Logística UC