El Diplomado en Big Data y Machine Learning proporciona los conocimientos para entender las técnicas y algoritmos de aprendizaje automático en el contexto de grandes volúmenes de datos. A través de sus cuatro cursos, el programa cubre la mayoría de las competencias requeridas para trabajar en esta área fascinante.
En uno de los cursos, aprenderás técnicas y herramientas para el manejo de Big Data (Hadoop, Spark, etc.). Otro curso te brindará las competencias para utilizar el lenguaje Python en el contexto del machine learning. Un tercer curso está enfocado íntegramente en la importante área de la visualización de información. Finalmente, el curso de aplicaciones ofrece una perspectiva sobre las aplicaciones más comunes y prometedoras para estas técnicas y herramientas.
El curso se estructura en cuatro cursos que emplean técnicas metodológicas activas. Gracias a estas técnicas, los participantes pueden interactuar con sus pares y el profesor-tutor a través de los recursos tecnológicos que ofrece la plataforma educativa virtual.
Dirigido a:
- Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Python.
- Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para interactuar y visualizar volúmenes grandes de datos.
Resultado de aprendizaje general:
- Implementar soluciones de ciencia de datos e inteligencia artificial que requieren el manejo de volúmenes de datos muy grandes (Big Data).
Requisitos de ingreso:
- Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
- Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
• MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
• Curso Herramientas de programación en Python para procesamiento de datos.
Al final del curso podrás:
- Identificar la problemática y particularidades del manejo de grandes volúmenes de dato en diferentes contextos.
- Distinguir los principios, bases técnicas y herramientas del ecosistema Hadoop.
- Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
- Reconocer el esquema de trabajo Apache Spark para el procesamiento de datos de propósito general.
- Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
- Aplicar herramientas de visualización para facilitar la interpretación de resultados.
Contenidos:
Ecosistema Hadoop
- Introducción a Big Data.
- Instalación de herramientas Hadoop.
Herramientas de Ecosistema Hadoop
- Hadoop MapReduce.
- Apache Hive.
- Apache Pig.
Apache Spark
- Programación en Apache Spark.
Data Analytics con Apache Spark
- Apache Flume.
- Spark Streaming.
- Spark SQL.
Machine Learning con Apache Spark
- Spark MLLIB: Algoritmos supervisados y no supervisados.
Técnicas de visualización
- Reducción de dimensionalidad.
Al final del curso podrás:
- Comprender aspectos formales de modelos de aprendizaje supervisado tradicionales, experimentando y comparando su rendimiento.
- Visualizar diferentes tipos de variables en una base de datos utilizando librerías de Python.
- Emplear modelos de redes neuronales artificiales básicas.
- Diseñar modelos de aprendizaje supervisado basados en regresiones.
- Implementar modelos de aprendizaje no supervisado a través de librerías de Python.
Contenidos:
Introducción al aprendizaje de máquinas con Python
- Introducción al aprendizaje de máquina. Tipos de problemas en aprendizaje de máquina.
Preprocesamiento de datos con Python
- Introducción a librerías del ecosistema de Data Science. Tipos de variables. Análisis descriptivo de variables. Transformación y visualización de variables. Imputación de datos.
Regresiones
- Aprendizaje supervisado. Regresión lineal. Regresiones polinomiales. Regresión con penalización. Regresión logística.
Aprendizaje supervisado
- Naive Bayes. Evaluación de clasificadores. Árboles de decisión. Random Forest y Random Forest para regresión.
Redes neuronales
- Introducción a las redes neuronales artificiales. Tecnologías para desarrollo de redes neuronales artificiales. Redes neuronales artificiales.
Aprendizaje no supervisado
- Aprendizaje no supervisado. K-Means. Cluster jerárquico. Evaluación de clusters. Reducción de dimensionalidad.
Al final del curso podrás:
- Evaluar visualizaciones de información existentes y proponer mejoras en ellas.
- Implementar en lenguaje Python gráficos simples y avanzados usando diversos tipos de datasets.
- Diseñar nuevas visualizaciones mediante la identificación de las relaciones entre tipos de datos, las tareas de visualización y los tipos de gráficos.
Contenidos:
- Ejemplos históricos de visualización de datos.
- Conceptos fundamentales de visualización de información.
- Funciones básicas de matplotlib y seaborn.
- Modelo anidado de Munzner para diseño y validación de visualización.
- Reglas y recomendaciones generales para visualizaciones efectivas.
- Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado.
- Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado.
- Reducción de dimensionalidad.
- Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
- Visualización básica de datos de texto y datos espaciales.
Al final del curso podrás:
- Identificar los principales conceptos y técnicas asociados a Machine Learning y ciencia de datos
- Reconocer la importancia y los principales desafíos de los datos
- Asociar las diversas técnicas con oportunidades de aplicación en los negocios
- Examinar las dificultades y oportunidades en la aplicación de técnicas de ciencia de datos y aprendizaje de máquina
Contenidos:
Introducción al aprendizaje de máquinas y ciencia de datos
- Conceptos de inteligencia de negocios y minería de datos, y de ciencia de datos y aprendizaje de máquina.
- El auge actual del aprendizaje de máquina e inteligencia artificial.
Tipos de datos y aplicaciones
- Aplicaciones sobre: transacciones estructuradas, texto, audio y video.
Técnicas de ciencia de datos y aprendizaje de máquina
- Visualización en ciencia de datos. Aprendizaje: supervisado, no supervisado y reforzado.
Aplicaciones en los negocios
- Aplicaciones de visualización en ciencia de datos. Aplicaciones de aprendizaje: supervisado, no supervisado y aprendizaje reforzado.
Casos de ciencia de datos
- Casos: en compañía de seguros, banca, retail y calidad del aire.
Casos de aprendizaje de máquina
- Caso en: transporte público, compras públicas, industria financiera y observación astronómica.
Nota: El orden de los cursos dependerá de la programación que realice la Dirección Académica.
¿Te gusta esta publicación?
Comparte esta publicación
40% Personas mayores de 60 años.
30% Exalumnos, colaboradores UC y DUOC, exalumnos de Educación Profesional de Ingeniería UC, Tarjeta vecino Providencia y Las Condes.
25% Convenio Ingeniería.
15% Funcionarios de servicios públicos.