Diplomado en Minería de datos (online)

Este programa ofrece un conjunto de herramientas de la disciplina Data Mining, lo que te permitirá dominar el análisis de datos y la predicción de comportamientos para tomar mejores decisiones en la organización.

Comenzarás con los fundamentos estadísticos y las competencias de programación esenciales, avanzando hacia técnicas y aplicaciones prácticas.

Lo mejor de todo es que no necesitas conocimientos previos en programación o estadística. Nuestro diplomado está diseñado para ser accesible tanto a profesionales técnicos, como a todo tipo de profesionales.

Diplomado en Minería de datos (online)

Antecedentes Generales

  • Fecha de inicio

    26 de mayo

  • Horas

    300 horas totales (140 horas directas y 160 horas indirectas)

  • Valor

    $2.290.000 en Chile / USD 2.544 resto del mundo ¡Consulta por descuento!

  • Tutor de apoyo permanente

  • 4 clases sincrónicas

  • Cuestionarios de selección múltiple

  • Proyectos aplicados

  • Material multimedia de apoyo

Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.

El Diplomado en Minería de datos se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de minería de datos permiten llegar a un nivel de profundidad más alto.

La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Todas las personas interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.

Todas las personas que han aprendido lo esencial de Data Mining, pero necesitan profundizar y adquirir fundamentos estadísticos.

Utilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.

Se recomienda contar con:
– Licenciatura, título profesional o técnico de mínimo cuatro años.
– Conocimientos básicos de programación en Phyton.
– Conocimientos de minería de datos o aprendizaje de máquina.
– Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
– Dos años de experiencia laboral.

Contenidos del Programa

Al final del curso podrás:
– Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
– Utilizar los comandos de control de flujo y los ciclos para la ejecución eficiente de operaciones básicas.
– Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos.
– Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
– Desarrollar programas en el lenguaje de programación Python para la resolución de problemas sencillos.

Contenidos
Módulo 1: Introducción a la programación
– Motivación: de los datos a la información y programación ¿cómo conviven hoy estos elementos en el mundo laboral?, ¿qué es la programación?, aplicaciones prácticas, la programación en el mundo laboral y cómo debe convertirse en un hábito. Secuencias de comandos en Python. Operaciones básicas. Creación y asignación de variables. Operaciones lógicas.

Módulo 2: Control de flujo
– Control de flujo: If, Else, Elif, uso en conjunto. Ciclos: While, For.

Módulo 3: Tipos de datos y funciones
– Tipos de datos: enteros, decimales, textos y listas. Strings: ¿qué es un string?, funciones básicas y avanzadas de un string. Funciones: ¿qué es una función?, ¿por qué ocupar funciones?, declaración y uso de funciones. Listas: creación de listas, obtener elementos, añadir elementos o quitar elementos, operaciones sobre listas.

Módulo 4: Procesamiento de datos
– Listas de listas. Archivos: cómo se interactúa con archivos y para qué sirven, leer y escribir archivos. Procesamiento de datos: carga y edición masiva, ejemplos prácticos.

Módulo 5: Diccionarios y tuplas
– Listas y listas de listas. Manipulación de listas. Funciones sobre listas. Diccionarios. Operaciones y aplicaciones de diccionarios. Aplicaciones con listas y diccionarios. Tuplas como tipo de dato inmutable. Operaciones sobre tuplas. Combinando listas, tuplas y diccionarios.

Módulo 6: Funciones
– Concepto de función. Definición de funciones. Parámetros y valores de retorno. Importación y llamado de módulos. Invocación de funciones y scope. Parámetros con nombre y parámetros por defecto. Funciones recursivas. Aplicación de funciones.

Al finalizar el curso podrás:
– Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
– Mostrar en forma gráfica distribuciones empíricas de los datos.
– Modelar un problema en base a distribuciones analíticas conocidas.
– Analizar la interrelación entre dos o más variables.
– Evaluar la validez de una hipótesis en base a los datos.

Contenidos:
– Análisis exploratorio de datos e introducción a las distribuciones
• Variables y transformaciones.

– Distribuciones y funciones de probabilidad
• Variables y efecto del tamaño.
• Funciones de probabilidad (PMFs).

– Funciones de probabilidad
• Distribuciones continuas.
• Familia exponencial.
• Funciones de distribución acumulada (CDFs).

– Modelación de distribuciones e introducción a las relaciones entre variables
• Distribuciones continuas.
• Gráficas distribución lognormal.
• Diagramas de dispersión.
• Correlación.

– Relación entre variables, correlación y una introducción al testeo de hipótesis
• Covarianza.
• Testeo de hipótesis.
• Diferencia de medias.
• Formalización.

– Testeo de hipótesis, regresión e introducción a las series de tiempo
• Testeo de correlación y testeo de proporciones.
• Mínimos cuadrados lineales.
• Introducción a las series de tiempo.

Al finalizar el curso podrás:
– Reconocer las principales teorías y prácticas de la Minería de Datos.
– Identificar relaciones interesantes en un conjunto de transacciones mediante el uso de reglas de asociación.
– Distinguir técnicas como árboles de decisión, clustering y otras, aplicándolas en escenarios prácticos reales.
– Evaluar la calidad y pertinencia de los resultados obtenidos, reconociendo las potencialidades y limitaciones de cada técnica.

Contenidos:
– Introducción a Minería de Datos y conceptos sobre Data Warehouse.
– Procesamiento, selección y transformación de datos.
– Reglas de asociación.
– Clasificación.
• Árbol de decisión.
• KNN.
• Random Forest.
– Clustering.
• K-Means.
• Clustering jerárquico.
– Introducción al Machine Learning.
• Modelo de entrenamiento.
• Métricas de evaluación.

Al finalizar el curso podrás:
– Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones.
– Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
– Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos.
– Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.

Contenidos:
– Series de tiempo
• Análisis visual de series de tiempo
• Componentes de una serie de tiempo.
• Estacionariedad de una serie de tiempo.
• Tratamiento de una serie de tiempo no estacionaria.
• Tipos de modelos de series de tiempo.
• Modelos MA.

– Minería de texto y web scraping
• Minería de texto
• Web scraping.

– Aprendizaje por refuerzo
• Aprendizaje por refuerzo.
• Métodos de Monte Carlo

– Q-Learning
• Funciones de valor.
• Q-Learning.

– Redes neuronales artificiales
• Estructura de una red neuronal artificial.
• Entrenamiento de redes neuronales artificiales.
• Otros tipos de redes neuronales.

– Nuevas tendencias de machine learning
• Modelos fundacionales.
• Inteligencia artificial generativa.

info Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

Cuerpo Docente

Jefe de Programa

Jaime Navón Cohen
Jaime Navón Cohen

Profesor Asociado del Departamento de Ciencia de la Computación UC. Ph.D. Computer Science, University of North Carolina at Chapel Hill.

Jaime Navón Cohen
Jaime Navón Cohen

Profesor Asociado del Departamento de Ciencia de la Computación UC. Ph.D. Computer Science, University of North Carolina at Chapel Hill.

Nicolás Alvarado Monárdez

Profesor Instructor Adjunto del Departamento de Ciencia de la Computación UC. Ph.D. en Ciencias de la Computación UC.

Sebastián Raveau

Profesor Asistente de Ingeniería de Transporte y Logística UC. Doctor en Ciencias de la Ingeniería e Ingeniero Civil de Industrias, mención en Transporte, UC.

Hernán Valdivieso
Hernán Valdivieso

Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área de trabajo es el desarrollo de técnicas de visualización.


¿te gusta esta publicación?
Comparte esta publicación