Diplomado en Big Data y Machine Learning (online)

Aprende usar en forma efectiva el lenguaje Python en el contexto de Ciencia de Datos y Machine Learning

Diseña y construye visualizaciones que ayuden a comprender y a comunicar información desde los datos.

Metodología online con metodologías activas, donde el participante puede interactuar con sus pares y profesor-tutor, a través de los recursos tecnológicos que provee la plataforma virtual.

Diplomado en Big Data y Machine Learning (online)

Antecedentes Generales

Fecha de inicio

28 de julio
Modalidad

Online asincrónico + Online clases en vivo
Horas

300 horas totales (140 horas directas y 160 horas indirectas)
Valor

$2.290.000 en Chile / USD 2.544 resto del mundo ¡Consulta por descuento!

Tutor de apoyo permanente
4 clases sincrónicas
Cuestionarios de selección múltiple
Proyectos aplicados
Material multimedia de apoyo

El Diplomado en Big Data y Machine Learning proporciona los conocimientos para entender las técnicas y algoritmos de aprendizaje automático en el contexto de grandes volúmenes de datos. A través de sus cuatro cursos, el programa cubre la mayoría de las competencias requeridas para trabajar en esta área fascinante.

En uno de los cursos, aprenderás técnicas y herramientas para el manejo de Big Data (Hadoop, Spark, etc.). Otro curso te brindará las competencias para utilizar el lenguaje Python en el contexto del machine learning. Un tercer curso está enfocado íntegramente en la importante área de la visualización de información. Finalmente, el curso de aplicaciones ofrece una perspectiva sobre las aplicaciones más comunes y prometedoras para estas técnicas y herramientas.

El diplomado se estructura en cuatro cursos que emplean técnicas metodológicas activas. Gracias a estas técnicas, los participantes pueden interactuar con sus pares y el profesor-tutor a través de los recursos tecnológicos que ofrece la plataforma educativa virtual.

Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Python.

Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para interactuar y visualizar volúmenes grandes de datos.

Implementar soluciones de ciencia de datos e inteligencia artificial que requieren el manejo de volúmenes de datos muy grandes (Big Data).

Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.

Si desea evaluar su nivel, puede realizar una prueba opcional gratuita aquí. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
• MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
• Curso Herramientas de programación en Python para procesamiento de datos.

Contenidos del Programa

Al final del curso podrás:
– Identificar la problemática y particularidades del manejo de grandes volúmenes de dato en diferentes contextos.
– Distinguir los principios, bases técnicas y herramientas del ecosistema Hadoop.
– Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
– Reconocer el esquema de trabajo Apache Spark para el procesamiento de datos de propósito general.
– Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
– Aplicar herramientas de visualización que faciliten la interpretación de resultados.

Contenidos:
Ecosistema Hadoop
– Introducción a Big Data.
– Instalación de herramientas Hadoop.

Herramientas de Ecosistema Hadoop
– Hadoop MapReduce.
– Apache Hive.
– Apache Pig.

Apache Spark
– Programación en Apache Spark.

Data Analytics con Apache Spark
– Apache Flume.
– Spark Streaming.
– Spark SQL.

Machine Learning con Apache Spark
– Spark MLLIB: Algoritmos supervisados y no supervisados.

Técnicas de visualización
– Reducción de dimensionalidad.

Al final del curso podrás:
– Comprender aspectos formales de modelos de aprendizaje supervisado tradicionales, experimentando y comparando su rendimiento.
– Visualizar diferentes tipos de variables en una base de datos utilizando librerías de Python.
– Emplear modelos de redes neuronales artificiales básicas.
– Diseñar modelos de aprendizaje supervisado basados en regresiones.
– Implementar modelos de aprendizaje no supervisado a través de librerías de Python.

Contenidos:
Introducción al aprendizaje de máquinas con Python
– Introducción al aprendizaje de máquina. Tipos de problemas en aprendizaje de máquina.

Preprocesamiento de datos con Python
– Introducción a librerías del ecosistema de Data Science. Tipos de variables. Análisis descriptivo de variables. Transformación y visualización de variables. Imputación de datos.

Regresiones
– Aprendizaje supervisado. Regresión lineal. Regresiones polinomiales. Regresión con penalización. Regresión logística.

Aprendizaje supervisado
– Naive Bayes. Evaluación de clasificadores. Árboles de decisión. Random Forest y Random Forest para regresión.

Redes neuronales
– Introducción a las redes neuronales artificiales. Tecnologías para desarrollo de redes neuronales artificiales. Redes neuronales artificiales.

Aprendizaje no supervisado
– Aprendizaje no supervisado. K-Means. Cluster jerárquico. Evaluación de clusters. Reducción de dimensionalidad.

Al final del curso podrás:
– Evaluar visualizaciones de información existentes y proponer mejoras en ellas.
– Implementar en lenguaje Python gráficos simples y avanzados usando diversos tipos de datasets.
– Diseñar nuevas visualizaciones mediante la identificación de las relaciones entre tipos de datos, las tareas de visualización y los tipos de gráficos.

Contenidos:
– Ejemplos históricos de visualización de datos.
– Conceptos fundamentales de visualización de información.
– Funciones básicas de matplotlib y seaborn.
– Modelo anidado de Munzner para diseño y validación de visualización.
– Reglas y recomendaciones generales para visualizaciones efectivas.
– Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado.
– Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado.
– Reducción de dimensionalidad.
– Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
– Visualización básica de datos de texto y datos espaciales.

Al final del curso podrás:
– Identificar los principales conceptos y técnicas asociados a Machine Learning y ciencia de datos.
– Reconocer la importancia y los principales desafíos de los datos.
– Asociar las diversas técnicas con oportunidades de aplicación en los negocios.
– Examinar las dificultades y oportunidades en la aplicación de técnicas de ciencia de datos y aprendizaje de máquina.

Contenidos:
Introducción al aprendizaje de máquinas y ciencia de datos
– Conceptos de inteligencia de negocios y minería de datos, y de ciencia de datos y aprendizaje de máquina.
– El auge actual del aprendizaje de máquina e inteligencia artificial.

Tipos de datos y aplicaciones
– Aplicaciones sobre: transacciones estructuradas, texto, audio y video.

Técnicas de ciencia de datos y aprendizaje de máquina
– Visualización en ciencia de datos. Aprendizaje: supervisado, no supervisado y reforzado.

Aplicaciones en los negocios
– Aplicaciones de visualización en ciencia de datos. Aplicaciones de aprendizaje: supervisado, no supervisado y aprendizaje reforzado.

Casos de ciencia de datos
– Casos: en compañía de seguros, banca, retail y calidad del aire.

Casos de aprendizaje de máquina
– Caso en: transporte público, compras públicas, industria financiera y observación astronómica.

El orden de los cursos dependerá de la programación que realice la Dirección Académica.

Cuerpo Docente

Jefe de Programa

Jaime Navón Cohen

Profesor Adjunto del Departamento de Ciencia de la Computación UC. Ph.D. Computer Science, University of North Carolina at Chapel Hill.

Patricio Cofré

Profesor y especialista en Inteligencia y Análisis de Negocios. Cofundador de Metric Arts. Ingeniero destacado UC 2017 y MVP de Microsoft desde 2016.

Fernando Florenzano

Magíster en Ciencias de la Ingeniería, PUC. Ingeniero Civil PUC.

Iván Lillo

Profesor Instructor en el Departamento de Ciencia de la Computación, Ingeniería UC. Doctor en Ciencias de la Ingeniería, UC.

Jaime Navón Cohen

Profesor Adjunto del Departamento de Ciencia de la Computación UC. Ph.D. Computer Science, University of North Carolina at Chapel Hill.

Denis Parra

Profesor Asistente, Depto. de Ciencia de la Computación, Ingeniería UC. Su área principal de trabajo se desarrolla en las temáticas de análisis de redes sociales, minería de datos y técnicas de visualización para sistemas recomendadores.

Francisco Pérez Galarce

Profesor de Educación Profesional de la Escuela de Ingeniería UC. Head of Advanced Analytics en BRAVE UP!

Gabriel Sepúlveda

Profesor Instructor en Departamento de Ciencia de la Computación, Ingeniería UC. Miembro del Laboratorio de Inteligencia Artificial (IALAB).

Hernán Valdivieso

Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área de trabajo es el desarrollo de técnicas de visualización.

¿te gusta esta publicación?

Comparte esta publicación

Descargar Brochure

Déjanos tus datos y recibe la información en tu correo:

Al momento de inscribirme autorizo a la Escuela de Ingeniería UC para mantener y tratar mis datos personales, todo conforme a la Ley Nº19.628, “Sobre Protección de la Vida Privada”.

* Acepto que la UC trate mis datos personales para esta actividad, y he leído y acepto la Política de Privacidad UC.

Contáctanos

programas.ing@uc.cl

(+56) 9 5504 4516

(+56) 9 3353 0870

Formas de pago

Pago disponible con tarjetas de crédito de Chile hasta en 12 cuotas para diplomados y 3 cuotas para cursos, precio sin interés.

Descuentos

Descuentos para diplomados (excepto online a tu ritmo y articulados con Magíster):

40% Personas mayores a 60 años.
30% Funcionarios UC y DUOC.
30% Exalumnos UC, Educación Profesional Ingeniería UC y DUOC.
30% Tarjeta vecino Providencia y Las Condes.
25% Convenio empresa Ingeniería.
15% Profesionales de servicios públicos.

Diplomado en Big Data y Machine Learning (online)

Antecedentes Generales

Fecha de inicio

Modalidad

Horas

Valor

Descripción

Dirigido a

Objetivos de aprendizaje

Requisitos de ingreso

Contenidos del Programa

Curso: Técnicas de Big Data para Machine Learning

Curso: Python para Machine Learning

Curso: Visualización de información en la era de Big Data

Curso: Aplicaciones de Machine Learning y Ciencia de Datos

Cuerpo Docente

Jefe de Programa

Jaime Navón Cohen

Profesores

Patricio Cofré

Fernando Florenzano

Iván Lillo

Jaime Navón Cohen

Denis Parra

Francisco Pérez Galarce

Gabriel Sepúlveda

Hernán Valdivieso

Programas relacionados

Diplomado en Estrategia de datos, Inteligencia Artificial y ética empresarial

Diplomado en Inteligencia Artificial en diseño y construcción

Diplomado en Estrategia de UX y producto digital con IA