Introducción a minería de datos y Machine Learning (online)
Aprende las principales teorías y prácticas de la Minería de Datos y Machine Learning.
Adquiere conocimientos de las técnicas más utilizadas en la creación de programas para extraer información de bases de datos y sus aplicaciones, comprendiendo sus potencialidades y limitaciones.
Este curso forma parte de cuatro Diplomados: Diplomado en Python y ciencia de datos, Diplomado en Ciencia de datos para la gestión, Diplomado Ejecutivo en inteligencia de negocios y Diplomado en Big Data y Cloud Computing.
Antecedentes Generales
El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego adentrarse en las técnicas y algoritmos asociados a la Minería de Datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de Machine Learning.
Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.
El enfoque del curso es práctico, privilegiando la experimentación mediante herramientas y entornos que permiten ejecutar y analizar ejemplos preconfigurados. Los estudiantes modificarán parámetros, observarán los efectos de dichos cambios y reflexionarán sobre su impacto en la calidad del modelo y la extracción de conocimiento.
Al finalizar el curso, los estudiantes comprenderán los principios teóricos y prácticos que sustentan las principales técnicas utilizadas en la minería de datos y el aprendizaje de máquina, pudiendo analizar sus resultados, evaluar su aplicabilidad en distintos contextos y reconocer sus potencialidades y limitaciones sin necesidad de programar directamente los algoritmos.
El desarrollo de estos aprendizajes se realizará a través de estudios de casos, mini proyectos prácticos, y el acceso a recursos especializados, lo que permitirá a los estudiantes experimentar, analizar y aplicar directamente los conceptos adquiridos.
La metodología de enseñanza y aprendizaje para este curso en línea se basa en técnicas metodológicas activas, permitiendo que el participante interactúe con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.
Profesionales que necesiten extraer conocimiento desde diferentes fuentes de información.
Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para procurar los datos de entrada al proceso de análisis.
Aplicar los conceptos fundamentales de Minería de Datos y los algoritmos de aprendizaje de máquina para el apoyo en la toma de decisiones basada en datos.
Sin requisitos de ingreso.
Contenidos del Programa
Al final del curso podrás:
– Reconocer las principales teorías y prácticas de la Minería de Datos.
– Identificar relaciones interesantes en un conjunto de transacciones mediante el uso de reglas de asociación.
– Distinguir técnicas como árboles de decisión, clustering y otras, aplicándolas en escenarios prácticos reales.
– Evaluar la calidad y pertinencia de los resultados obtenidos, reconociendo las potencialidades y limitaciones de cada técnica.
Contenidos:
– Introducción a Minería de Datos y conceptos sobre Data Warehouse.
– Procesamiento, selección y transformación de datos.
– Reglas de asociación.
– Clasificación.
• Árbol de decisión.
• KNN.
• Random Forest.
– Clustering.
• K-Means.
• Clustering jerárquico.
– Introducción al Machine Learning.
• Modelo de entrenamiento.
• Métricas de evaluación.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC. Ph.D. Computer Science, University of North Carolina at Chapel Hill.
Hernán Valdivieso
Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área de trabajo es el desarrollo de técnicas de visualización.