El Diplomado en Big Data y Machine Learning aporta los conocimientos que te permitirán entender las técnicas y algoritmos asociados al aprendizaje de máquina en el contexto de gigantescos volúmenes de datos. El programa entrega, a través de sus 4 cursos, la mayor parte de las competencias que se requieren para trabajar en esta espectacular área. En uno de los cursos, aprenderás las técnicas y herramientas para el manejo de Big Data (Hadoop, Spark, etc). Un segundo curso, te entregará las competencias para utilizar el lenguaje Python en el contexto de machine learning. Otro de sus cursos, está enfocado íntegramente al importante tema de la visualización de la información. Por último, el curso de aplicaciones entrega una mirada al ámbito y tipo de aplicaciones más comunes y prometedoras para estas técnicas y herramientas.
El formato del Diplomado en Big Data y Machine Learning es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.
Dirigido a:
- Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Python.
- Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para interactuar y visualizar volúmenes grandes de datos.
Objetivos de aprendizaje:
- Conocer la problemática de Big Data, las plataformas más importantes y las técnicas que permiten manejar esa data. Además, conocer las principales aplicaciones de Ciencia de Datos y Machine Learning.
- Comprender e implementar los principales algoritmos de Machine Learning usando el lenguaje Python.
- Presentar visualmente la data en forma efectiva.
Requisitos de Ingreso:
- Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
- Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
- MOOC “Introducción a la Programación en Python I: Aprendiendo a programar con Python”, disponible en el siguiente link: https://www.coursera.org/learn/aprendiendo-programar-python
- Curso “Herramientas de programación en Python para procesamiento de datos”, disponible en el siguiente link: https://teleduc.uc.cl/curso/herramientas-programacion-python-procesamiento-datos/
Al final del curso podrás:
- Entender la problemática y particularidades del manejo de Big Data.
- Conocer los principios, bases técnicas y herramientas del ecosistema Hadoop.
- Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
- Conocer Apache Spark, un framework de procesamiento de datos de propósito general.
- Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
- Aplicar herramientas de visualización para facilitar la interpretación de resultados.
Contenidos:
- Introducción a Big data
- El ecosistema Hadoop
- HDFS, YARN
- Hadoop MapReduce
- Herramientas del ecosistema Hadoop
- Fundamentos de Apache Spark
- Implementación de aplicaciones sobre Spark
- Spark SQL
- Spark MLlib
- Técnicas de visualización
Al final del curso podrás:
- Identificar, procesar y visualizar diferentes tipos de variables en una base de datos utilizando librerías de Python.
- Diseñar e implementar modelos de aprendizaje supervisado basados en regresiones.
- Comprender aspectos formales de modelos de aprendizaje supervisado tradicionales, experimentando y comparando su rendimiento.
- Reconocer y emplear modelos de redes neuronales artificiales básicas
- Comprender, implementar e interpretar modelos de aprendizaje no supervisado a través de librerías de Python.
Contenidos:
- Conceptos fundamentales de Machine Learning
- Análisis, procesamiento y visualización de datos a través de Python
- Algoritmos de aprendizaje supervisado en Python utilizando scikit-learn:
• Regresión Lineal
• Regresión Logística
• Regresiones Polinomiales
• Regresiones con penalización
• Árboles de Decisión
• Random Forest
• Random Forest para regresiones
• Naive Bayes
• Vecino más cercano
• Redes Neuronales
• Selección de modelos
- Algoritmos de aprendizaje no supervisado en Python utilizando scikit-learn:
• K-means
• Mezcla de Gaussianas
• Cluster Jerárquico
• Autoencoders
Al final del curso podrás:
- Analizar y evaluar visualizaciones de información existentes, así como proponer mejoras.
- Identificar relaciones entre tipos de datos, tareas de visualización y tipos de gráficos para diseñar visualizaciones de información.
- Diseñar e implementar en lenguaje Python gráficos simples y avanzados usando datasets tabulares.
- Diseñar e implementar en lenguaje Python gráficos usando datasets de red.
- Diseñar e implementar en lenguaje Python gráficos para visualizar datos de texto y espaciales.
Contenidos:
- Ejemplos históricos de visualización de datos
- Conceptos fundamentales de visualización de información
- Funciones básicas de matplotlib y seaborn
- Modelo anidado de Munzner para diseño y validación de visualización
- Reglas y recomendaciones generales para visualizaciones efectivas
- Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado
- Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado
- Reducción de dimensionalidad
- Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado
- Visualización básica de datos de texto
- Visualización básica de datos espaciales
Al final del curso podrás:
- Identificar los principales conceptos y técnicas asociados a Machine Learning y ciencia de datos
- Reconocer la importancia y los principales desafíos de los datos
- Asociar las diversas técnicas con oportunidades de aplicación en los negocios
- Examinar las dificultades y oportunidades en la aplicación de técnicas de ciencia de datos y aprendizaje de máquina
Contenidos:
- Conceptos de inteligencia de negocios y de minería de datos
- Conceptos de ciencia de datos y de machine learning
- Aplicación al ámbito de transacciones estructuradas
- Aplicación al ámbito de aplicaciones de texto, audio y video
- Aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado
- Aplicaciones de aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado
- Estudio de casos: seguros, banca, retail, calidad del aire, transporte, compras públicas, finanzas, astronomía
Nota:
¿Te gusta esta publicación?
Comparte esta publicación