Introducción a minería de datos y Machine Learning (online)

Aprende las principales teorías y prácticas de la Minería de Datos y Machine Learning.

Adquiere conocimientos de las técnicas más utilizadas en la creación de programas para extraer información de bases de datos y sus aplicaciones, comprendiendo sus potencialidades y limitaciones.

Este curso forma parte de cuatro Diplomados: Diplomado en Python y ciencia de datos, Diplomado en Ciencia de datos para la gestión, Diplomado Ejecutivo en inteligencia de negocios y Diplomado en Big Data y Cloud Computing.

Curso Introducción a Minería de Datos y Machine Learning (Online)

Antecedentes Generales

  • Fecha de inicio

    25 de marzo

  • Horas

    75 horas totales (35 horas directas y 40 horas indirectas)

  • Valor

    $550.000 en Chile / USD 612 resto del mundo ¡Consulta por descuento!

  • Tutor de apoyo permanente

  • 1 clase sincrónica

  • 3 cuestionarios de selección múltiple

  • 3 proyectos aplicados

  • Material multimedia y de apoyo

El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego profundizar en las técnicas y algoritmos asociados a la minería de datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de machine learning.

Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, métodos de regresión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.

El enfoque del curso es práctico, brindando oportunidades para aplicar los conocimientos en proyectos y casos concretos. Se proporcionan herramientas de extracción y análisis de información para que una organización pueda generar valor a partir de los datos, mejorando su posición competitiva.

Al finalizar el curso, los estudiantes contarán con conocimientos teóricos y prácticos sobre las principales técnicas utilizadas en la creación de programas capaces de extraer conocimiento relevante de bases de datos. También comprenderán algunas de las principales aplicaciones actuales de estas técnicas, así como sus potencialidades y limitaciones.

Los contenidos serán abordados en 6 clases en línea (8 semanas), donde se entregarán los contenidos mediante recursos interactivos que integran videos, esquemas, artículos, lecturas y preguntas formativas. El curso se impartirá a través de una plataforma educativa virtual.

Profesionales que necesiten extraer conocimiento desde diferentes fuentes de información.

Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para procurar los datos de entrada al proceso de análisis.

Aplicar los conceptos fundamentales de minería de datos y los algoritmos de aprendizaje de máquina para el apoyo en la toma de decisiones basada en datos.

Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.

Si desea evaluar su nivel, puede realizar una prueba opcional gratuita aquí.

Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.

A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
Curso Herramientas de programación en Python para procesamiento de datos.

Es deseable contar con algún grado de conocimiento matemático (álgebra lineal, estadística básica y cálculo).

Contenidos del Programa

Al final del curso podrás:
– Identificar las principales teorías y prácticas de la minería de datos.
– Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones.
– Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales.

Contenidos:
Conceptos sobre Data Warehouse y uso de Dataframes

Procesamiento y consolidación de datos
– Preprocesamiento de datos.
– Selección y transformación de datos.

Reglas de asociación

Aplicación de los algoritmos Random Forest y KNN
– Árbol de decisión.
– KNN.
– Random Forest.

Aplicación de los algoritmos K-Means y DBSCAN
– Clustering.
– K-Means.
– Clustering jerárquico.

Introducción al Machine Learning
– Modelo de entrenamiento.
– Métricas de evaluación.

Cuerpo Docente

Jefe de Programa

Jaime Navón Cohen

Profesor Asociado del Departamento de Ciencia de la Computación UC

Mauricio Arriagada

Doctor en Ciencias de la Ingeniería UC


¿te gusta esta publicación?
Comparte esta publicación