Diplomado en Ciencia de datos para la gestión (online)
Conocimientos y herramientas de inteligencia artificial para una óptima gestión, a través de la lectura, interpretación y administración de los datos.
Competencias para transformar los negocios mediante técnicas de inteligencia de negocios y ciencia de datos, utilizando información de variables como productos y servicios, compradores y oferentes, hábitos de compra , entre otras.
La metodología online consiste en herramientas activas, donde el participante puede interactuar con sus pares y profesor-tutor, a través de los recursos tecnológicos que provee la plataforma educativa virtual.
Antecedentes Generales
Este diplomado está orientado a la gente que quiere adquirir las competencias fundamentales de Ciencias de Datos pero que no necesariamente tiene una base matemática, ni tampoco se interesa por los detalles de los algoritmos, sino más bien en la forma de ponerlo en práctica en los negocios y las organizaciones.
Todo trabajo en ciencia de datos comienza con la obtención de datos, y una de las principales fuentes son las bases de datos. Un curso de Python y bases de datos te proporcionará las competencias para interactuar con un motor relacional o un motor noSQL desde un programa en Python. El curso de Minería de Datos y Machine Learning enseña las principales técnicas, algoritmos y métodos que permiten utilizar los datos para comprender qué está sucediendo y obtener insights que faciliten la toma de decisiones. El curso de visualización se enfoca en la capacidad de producir visualizaciones efectivas a partir de grandes cantidades de datos difíciles de interpretar. Por último, el curso de Presente y Futuro de la Inteligencia de Negocios sitúa todo en la perspectiva de los negocios, proporcionando una visión amplia de lo que es y hacia dónde se dirige la Inteligencia de Negocios en la actualidad.
El Diplomado se estructura en cuatro cursos que emplean técnicas metodológicas activas. Gracias a estas técnicas, los participantes pueden interactuar con sus pares y con el profesor-tutor a través de los recursos tecnológicos que ofrece la plataforma educativa virtual.
Profesionales interesados en adquirir competencias en el área de Ciencia de Datos para aplicarlos en la gestión o la transformación digital de los negocios.
Aplicar técnicas de minería de datos, analítica e inteligencia de negocios para la transformación digital y la gestión guiada por datos.
Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
Si desea evaluar su nivel, puede realizar una prueba opcional gratuita aquí. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
• MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
• Curso Herramientas de programación en Python para procesamiento de datos.
Es deseable contar con algún grado de conocimiento matemático (álgebra lineal, estadística básica y cálculo).
Contenidos del Programa
Al final del curso podrás:
– Describir las características de una base de datos relacional y una base de documentos.
– Interactuar directamente con un motor de bases de datos desde la herramienta de administración.
– Escribir consultas simples utilizando el lenguaje SQL.
– Formular consultas simples de una base de datos relacional mediante el lenguaje standard SQL.
– Construir programas Python que se conecten a un motor de bases de datos información.
Contenidos:
Conceptos y familiarización con ambiente de trabajo
– Conceptos fundamentales de bases de datos. El modelo relacional. MySQL desde el Workbench.
Crear una BD simple con solo dos tablas y poblarla con información
– Introducción al lenguaje SQL. Creación de una base de datos desde Python. Tablas y tipos de datos. Creación de tablas desde Python. Agregar y eliminar información a una tabla desde Python.
SQL y Dataframes
– Introducción a Pandas y Dataframes. SQL joins. Transacciones en bases de datos. Eliminación y modificación de filas en una tabla.
Extracción de información más sofisticada de la BD con consultas más complejas y trabajo con Dataframes
– Operaciones de conjunto y cláusulas de agrupación. Ordenamiento y agrupación. Carga de contenido csv desde una API Web. Procesamiento de un archivo en formato csv.
Bases de datos NoSQL de documentos, MongoDB y JSON
– Bases de datos NoSQL. Introducción a MongoDB. El formato JSON. MongoDB desde Python.
Extraer y procesar información JSON desde una BD MongoDB y desde una API en la Web y procesarla con un programa Python
– Conectando con MongoDB. Interactuando con el motor MongoDB desde un programa. Procesamiento de JSON desde Python. Extracción de JSON desde una API Web.
Al final del curso podrás:
– Conocer y comprender las principales teorías y prácticas de la emergente área de minería de datos.
– Aplicar reglas de asociación para encontrar relaciones en un set de transacciones.
– Desarrollar soluciones a problemas reales de Big Data y ciencia de datos que involucren la necesidad de técnicas de minería de datos como árboles de decisión y clustering.
– Implementar soluciones usando herramientas de software de minería de datos aplicándolas en datos reales.
Contenidos:
Conceptos sobre Data Warehouse y uso de Dataframes
Procesamiento y consolidación de datos
– Preprocesamiento de datos.
– Selección y transformación de datos.
Reglas de asociación
Aplicación de los algoritmos Random Forest y KNN
– Árbol de decisión.
– KNN.
– Random Forest.
Aplicación de los algoritmos K-Means y DBSCAN
– Clustering.
– K-Means.
– Clustering jerárquico.
Introducción al Machine Learning
– Modelo de entrenamiento.
– Métricas de evaluación.
Al final del curso podrás:
– Evaluar visualizaciones de información existentes y proponer mejoras en ellas.
– Implementar en lenguaje Python gráficos simples y avanzados usando diversos tipos de datasets.
– Diseñar nuevas visualizaciones mediante la identificación de las relaciones entre tipos de datos, las tareas de visualización y los tipos de gráficos.
Contenidos:
– Ejemplos históricos de visualización de datos.
– Conceptos fundamentales de visualización de información.
– Funciones básicas de matplotlib y seaborn.
– Modelo anidado de Munzner para diseño y validación de visualización.
– Reglas y recomendaciones generales para visualizaciones efectivas.
– Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado.
– Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado.
– Reducción de dimensionalidad.
– Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
– Visualización básica de datos de texto y datos espaciales.
Al final del curso podrás:
– Comprender las características de una plataforma moderna de análisis de datos y los desafíos de la forma actual de hacer inteligencia de negocios.
– Utilizar los principios de agilidad aplicados a los proyectos de inteligencia de negocios.
– Identificar los principios y roles básicos asociados al gobierno de datos.
– Comprender la importancia del pensamiento analítico basado en los datos.
– Describir las características e importancia del rol de traductor analítico.
Contenidos:
Módulo 1: Conceptos de inteligencia de negocios
– Conceptos de inteligencia de negocios.
– Plataforma clásica de inteligencia de negocios.
– Nuevas tendencias que impactan la inteligencia de negocios.
– Herramientas: introducción, primeros pasos, elementos reporte I.
Módulo 2: Plataforma moderna de inteligencia de negocios
– Desafíos de inteligencia de negocios actual.
– Presentación y componentes de la plataforma moderna de análisis de datos.
– Centralización vs descentralización.
– Herramienta: elementos reporte II y campos calculados.
Módulo 3: Agilidad y gobierno en inteligencia de negocios
– Agilidad en inteligencia de negocios.
– Introducción, roles asociados y desafíos del gobierno de datos.
– Herramientas: agregar información al modelo.
Módulo 4: Calidad de datos
– Introducción, metodología y desafíos de la calidad de datos.
Módulo 5: Pensamiento analítico
– Introducción al pensamiento analítico.
– Pensamiento analítico y el valor de los datos.
– El nuevo rol del traductor analítico.
Módulo 6: El futuro de la inteligencia de negocios
– Próximos años: principales desafíos.
– El rol de los gerentes y directivos de la organización.
– El (probable) invierno analítico.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Mauricio Arriagada
Doctor en Ciencias de la Ingeniería UC
Fernando Florenzano
Magíster en Ciencias de la Ingeniería, PUC. Ingeniero Civil PUC.
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Denis Parra
Profesor Asistente, Depto. de Ciencia de la Computación, Ingeniería UC
Cristián Rodríguez Arenas
Cofundador en Archetype
Hernán Valdivieso
Profesor Instructor, Depto. de Ciencia de la Computación, Ingeniería UC