calendar correo curso diplomado horas lugar modalidad in-company magister magisteres programa-avanzado quotes reloj telefono contacto contacto grad video
Escuela de Ingeniería
Coincidencias exactas
Buscar por
Seleccionar todos
Magisters
Diplomados
Cursos
Mooc
Profesores
Noticias
Páginas

Diplomado en Minería de datos (online)

Este programa ofrece un conjunto de herramientas de la disciplina Data Mining, lo que te permitirá dominar el análisis de datos y la predicción de comportamientos para tomar mejores decisiones en la organización.

Comenzarás con los fundamentos estadísticos y las competencias de programación esenciales, avanzando hacia técnicas y aplicaciones prácticas.

Lo mejor de todo es que no necesitas conocimientos previos en programación o estadística. Nuestro diplomado está diseñado para ser accesible tanto a profesionales técnicos, como a todo tipo de profesionales.

Antecedentes Generales

01/10/2024
4 cursos
300 horas totales (140 horas directas y 160 horas indirectas)
$2.190.000 en Chile / USD 2.738 resto del mundo ¡Consulta por descuento!


programas@ing.puc.cl
(+56) 9 5504 4516 - (+56) 9 3353 0870

Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.

El Diplomado en Minería de datos se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de minería de datos permiten llegar a un nivel de profundidad más alto.

La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Dirigido a:
- Todas las personas interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
- Todas las personas que han aprendido lo esencial de Data Mining, pero necesitan profundizar y adquirir fundamentos estadísticos.

Resultado de aprendizaje general:
- Utilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.

Requisitos de ingreso
Se recomienda contar con:
- Licenciatura, título profesional o técnico de mínimo cuatro años.
- Conocimientos básicos de programación en Phyton.
- Conocimientos de minería de datos o aprendizaje de máquina.
- Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
- Dos años de experiencia laboral.

Contenidos del Programa

Al final del curso podrás: Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos; Utilizar los comandos de control de flujo y los ciclos para la dirigir y repetir eficientemente un conjunto de operaciones básicas; Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos; Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos; Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.

Contenidos
Módulo 1: Introducción a la programación
- Motivación: de los datos a la información, datos, información y programación ¿cómo conviven hoy estos elementos en el mundo laboral?, ¿qué es la programación?, aplicaciones prácticas, la programación en el mundo laboral y cómo debe convertirse en un hábito. Secuencias de comandos en Python. Operaciones básicas. Creación y asignación de variables. Operaciones lógicas.

Módulo 2: Control de flujo
- Control de flujo: If, Else, Elif, uso en conjunto. Ciclos: While, For

Módulo 3: Tipos de datos y funciones
- Tipos de datos: enteros, decimales, textos y listas. Strings: ¿qué es un string?, funciones básicas y avanzadas de un string. Funciones: ¿qué es una función?, ¿por qué ocupar funciones?, declaración y uso de funciones. Listas: creación de listas, obtener elementos, añadir elementos o quitar elementos, operaciones sobre listas.

Módulo 4: Procesamiento de datos
- Listas de listas. Archivos: cómo se interactúa con archivos y para qué sirven, leer y escribir archivos. Procesamiento de datos: carga y edición masiva, ejemplos prácticos.

Módulo 5: Diccionarios y tuplas
- Listas y listas de listas. Manipulación de listas. Funciones sobre listas. Diccionarios. Operaciones y aplicaciones de diccionarios. Aplicaciones con listas y diccionarios. Tuplas como tipo de dato inmutable. Operaciones sobre tuplas. Combinando listas, tuplas y diccionarios.

Módulo 6: Funciones
- Concepto de función. Definición de funciones. Parámetros y valores de retorno. Importación y llamado de módulos. Invocación de funciones y scope. Parámetros con nombre y parámetros por defecto. Funciones recursivas. Aplicación de funciones.

Al finalizar el curso podrás:
- Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.. Mostrar en forma gráfica distribuciones empíricas de los datos. Modelar un problema en base a distribuciones analíticas conocidas. Analizar la interrelación entre dos o más variables. Evaluar la validez de una hipótesis en base a los datos.

Contenidos:
Análisis exploratorio de datos e introducción a las distribuciones
- Variables y transformaciones.

Distribuciones y funciones de probabilidad
- Variables y efecto del tamaño. Funciones de probabilidad (PMFs).

Funciones de probabilidad
- Distribuciones continuas. Familia exponencial. Funciones de distribución acumulada (CDFs).

Modelación de distribuciones e introducción a las relaciones entre variables
- Distribuciones continuas. Gráficas distribución lognormal. Diagramas de dispersión. Correlación.

Relación entre variables, correlación y una introducción al testeo de hipótesis
- Covarianza. Testeo de hipótesis.
- Diferencia de medias. Formalización.

Testeo de hipótesis, regresión e introducción a las series de tiempo
- Testeo de correlación y testeo de proporciones. Mínimos cuadrados lineales.
- Introducción a las series de tiempo.

Al finalizar el curso podrás:
- Identificar las principales teorías y prácticas de la Minería de Datos.  Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones.  Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales 

Contenidos
Conceptos sobre Data Warehouse y uso de Dataframes

Procesamiento y consolidación de datos
- Preprocesamiento de datos. Selección y transformación de datos.

Reglas de asociación

Aplicación de los algoritmos Random Forest y KNN
- Árbol de decisión. KNN. Random Forest.

Aplicación de los algoritmos K-Means y DBSCAN
- Clustering.  K-Means. Clustering jerárquico.

Introducción al Machine Learning
- Modelo de entrenamiento. Métricas de evaluación.

Al finalizar el curso podrás:
- Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones. Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
- Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos. Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.

Contenidos:
Series de tiempo
- Series de tiempo: análisis visual, componentes, estacionariedad y tipos de modelos
- Tratamiento de una serie de tiempo no estacionaria.
- Modelos MA.

Minería de texto y web scraping
- Minería de texto. Web scraping.

Aprendizaje por refuerzo
- Aprendizaje por refuerzo. Métodos de Monte Carlo.

Q-Learning
- Funciones de valor. Q-Learning.

Redes neuronales artificiales
- Estructura de una red neuronal artificial. Entrenamiento de redes neuronales artificiales. Otros tipos de redes neuronales.

Nuevas tendencias de machine learning
- Modelos fundacionales. Inteligencia artificial generativa.

Nota: Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

Cuerpo Académico


¿Te gusta esta publicación?

Comparte esta publicación


Diplomado en Minería de datos (online)

Déjanos tus datos y recibe la información en tu correo:

Al momento de inscribirme autorizo a la Escuela de Ingeniería UC para mantener y tratar mis datos personales, todo conforme a la Ley Nº19.628, “Sobre Protección de la Vida Privada”. Revisa las Políticas UC aquí.
Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y términos del servicio de Google.

Webpay
Pago disponible con tarjetas de crédito de Chile hasta en 12 cuotas precio sin interés

 

40% Personas mayores de 60 años.
30% Exalumnos, colaboradores UC y DUOC, exalumnos de Educación Profesional de Ingeniería UC, Tarjeta vecino Providencia y Las Condes.
25% Convenio Ingeniería.
15% Funcionarios de servicios públicos.

Programas relacionados

Descargar Brochure
Necesitas ayuda? Conversemos