Diplomado en Big Data y Cloud Computing (online)
¿Quieres aprovechar al máximo las oportunidades que la era digital tiene para ofrecerte? ¡Este diplomado es lo que necesitas! Consta de dos cursos que cubren las temáticas tradicionales de Big Data y Machine Learning, y otros dos cursos que se centran en el nuevo escenario de la nube y cómo aprovecharlo para proyectos de Ciencia de Datos y Machine Learning.
Después de completar el programa podrás extraer el máximo valor de los datos disponibles, desarrollando aplicaciones avanzadas que utilicen técnicas de minería de datos y aprendizaje automático. Podrás trabajar con servicios en la nube, lo que significa que implementarás tus soluciones de manera eficiente y efectiva.
Antecedentes Generales
La disponibilidad de servicios de cómputo y almacenamiento de datos en la nube ha ocasionado profundos cambios en la forma en que se diseñan los sistemas, capaces de incorporar «inteligencia», a través del uso de técnicas de Machine Learning (ML) sobre volúmenes muy grandes de datos (Big Data). Tradicionalmente, el construir este tipo de soluciones requería de hardware costoso y difícil de dimensionar en el inicio y, por otra parte, de expertos en ingeniería de datos capaces de implementarlos. Gracias a la oferta de servicios cognitivos y de Big Data en la nube, totalmente administrados, la barrera ha disminuido significativamente. Por un lado, se reduce la necesidad de expertise y por otro, la elasticidad inherente de las soluciones en la nube permite partir pequeño e ir creciendo solo en la medida que se requiera.
Este programa incluye dos cursos que abordan las temáticas tradicionales de Big Data y Machine Learning y otros dos cursos que abordan este nuevo escenario de la nube, especialmente en cuanto a oportunidades para proyectos de Ciencia de Datos y Machine Learning.
El formato de estudio es 100% en línea y se estructura sobre técnicas metodológicas activas, mediante las cuales el participante puede interactuar con sus pares y tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual. Se contempla el ejercicio práctico de los conocimientos adquiridos a través de mini proyectos de aplicación.
Profesionales, especialmente del área tecnológica, que estén involucrados o planean participar en proyectos de Big Data y Machine Learning en sus organizaciones, con el interés de ampliar sus herramientas e incorporar soluciones basadas en la nube, con ventajas técnicas y económicas.
Utilizar herramientas y servicios disponibles en la nube para construir soluciones que incorporen Big Data e inteligencia artificial.
A responsabilidad del estudiante, se sugiere contar con:
– Grado de licenciatura en computación o en tecnologías de información, ingenieros civiles, ingenieros de ejecución en computación o equivalente. O bien, un grado de licenciatura en otras carreras que incluyan competencias de programación a nivel intermedio.
– Se recomienda conocimiento en sistema operativo Windows y la disponibilidad de un PC. con una versión de este sistema operativo actualizado.
Contenidos del Programa
Al final del curso podrás:
– Conocer y comprender las principales teorías y prácticas de la emergente área de Minería de Datos.
– Aplicar reglas de asociación para encontrar relaciones en un set de transacciones.
– Desarrollar soluciones a problemas reales de Big Data y ciencia de datos que involucren la necesidad de técnicas de Minería de Datos como árboles de decisión y clustering.
– Implementar soluciones usando herramientas de software de Minería de Datos aplicándolas en datos reales.
Contenidos:
– Conceptos fundamentales de minería de datos.
– Preparación de datos y reducción de información.
– Reglas de asociación.
– Algoritmos de clasificación.
– Algoritmos de Clustering y medidas de similaridad.
– Selección de modelos e introducción a Machine Learning.
Al final del curso podrás:
– Entender la problemática y particularidades del manejo de Big Data.
– Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
– Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
– Aplicar herramientas de visualización para facilitar la interpretación de resultados.
Contenidos:
– Conceptos fundamentales de Minería de Datos.
– Introducción a Big Data.
– El ecosistema Hadoop.
– HDFS, YARN.
– Hadoop MapReduce.
– Herramientas del ecosistema Hadoop.
– Fundamentos de Apache Spark.
– Implementación de aplicaciones sobre Spark.
– Spark SQL.
– Spark MLlib.
– Técnicas de visualización.
Al final del curso podrás:
– Identificar las principales categorías disponibles en las grandes plataformas de computación en la nube.
– Discutir ventajas y riesgos una solución tecnológica genérica basada en computación en la nube.
– Describir las principales tecnologías habilitantes relacionadas con computación en la nube.
– Utilizar servicios básicos de cómputo y almacenamiento en la nube.
Contenidos:
– Introducción: ¿Qué es Cloud Computing? características principales, tipos de servicio y tipos de nube.
– Tecnologías habilitantes (máquinas virtuales, arquitecturas orientadas a servicio, etc.).
– Virtualización.
– Principales plataformas de servicios en la nube: Amazon AWS, Google Cloud, Microsoft Azure.
– Tipos de servicios en la nube: desde el fierro virtual a los servicios cognitivos.
– Tipos de almacenamiento en la nube.
– Aspectos de seguridad.
Al final del curso podrás:
– Identificar las soluciones tecnológicas disponibles en los principales proveedores de Cloud que incorporan aprendizaje de máquina.
– Desarrollar aplicaciones de Machine Learning usando servicios de Azure y de GCP.
– Construir aplicaciones que incorporen los servicios cognitivos de imágenes, texto o voz disponibles en las grandes plataformas de servicios Cloud.
Contenidos:
– Introducción a Big Data y ML.
– Modelos de regresión y clasificación.
– Preparación de datos, el pipeline de datos.
– Manejo de Big Data en la nube.
– Servicios para ML en Azure.
– Azure Machine Learning Studio.
– ML automatizado (Azure AML).
– Servicios cognitivos en Azure.
– AutoML en GCP.
– Introducción a Vertex AI en GCP.
– Servicios cognitivos en GCP.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Mauricio Arriagada
Doctor en Ciencias de la Ingeniería UC
Stefanni Cavaletto Hevia
Senior Customer Engineer (ML & AI) en Google
Mauricio Gamboa
Consultor en Diseño, Desarrollo e Implementación de Aplicaciones en Entornos Microsoft, , La Salle Campus Madrid
Iván Lillo
Profesor Instructor, Depto. de Ciencia de la Computación, Ingeniería UC
Gabriel Sepúlveda
Profesor Instructor. Departamento de Ciencia de la Computación. Escuela de Ingeniería UC