Visualización de información en la era del Big Data (online)
Aprende a analizar y evaluar visualizaciones de información existentes y, también, a diseñar e implementar representaciones visuales de datos.
Dirigido a profesionales con conocimientos de programación, que puedan o no estar involucrados en el área de Ciencia de Datos, o simplemente que estén interesados en aprender más de los modos de visualización.
Este curso forma parte del Diplomado en Ciencia de datos para la gestión y del Diplomado en Big Data y Machine Learning.
Antecedentes Generales
La visión desempeña un papel fundamental en nuestro sistema cognitivo humano. Presentar información en formato visual puede ayudarnos en diversas tareas, como realizar análisis exploratorio de datos, comunicar los resultados de análisis, detectar problemas en fuentes de datos existentes y respaldar nuestra toma de decisiones. Para crear visualizaciones de datos efectivas en estas tareas, es necesario no solo aprender herramientas de software, sino también comprender los principios visuales y cognitivos que influyen en nuestra percepción. Además, es crucial identificar la relación entre tipos de datos y distintos formatos de representación visual.
Los estudiantes de este curso adquirirán conocimientos sobre los conceptos fundamentales de visualización de información, lo que les permitirá analizar y evaluar visualizaciones existentes. Posteriormente, aprenderán una metodología para diseñar y evaluar visualizaciones de información efectivas: el modelo anidado de Munzner. Con estos principios y el modelo anidado, los estudiantes aprenderán prácticamente cómo seleccionar la codificación visual óptima para diversos tipos de conjuntos de datos (tabulares, de red, espaciales, de texto) y atributos (continuos, categóricos, ordinales). Además, se introducirá el concepto de reducción de dimensionalidad, que los estudiantes aplicarán para visualizar datos con un gran número de atributos o dimensiones.
Los contenidos serán abordados en 6 clases en línea (8 semanas), donde se entregarán los contenidos mediante recursos interactivos que integran videos, esquemas, artículos, lecturas y preguntas formativas. Esto se impartirá a través de una plataforma educativa virtual.
Profesionales que necesitan evaluar la calidad y efectividad de visualizaciones de información, y que puedan proponer mejoras para la presentación visual de los datos.
Interesados en el área de Ciencia de Datos que deseen adquirir conocimientos para diseñar e implementar visualizaciones de información efectivas para satisfacer necesidades de información.
Diseñar visualización de máxima efectividad utilizando distintos tipos de datasets.
Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
Si desea evaluar su nivel de Python, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python
Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
• MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
• Curso Herramientas de programación en Python para procesamiento de datos.
Contenidos del Programa
Al final del curso podrás:
– Evaluar visualizaciones de información existentes y proponer mejoras en ellas.
– Implementar en lenguaje Python gráficos simples y avanzados usando diversos tipos de datasets.
– Diseñar nuevas visualizaciones mediante la identificación de las relaciones entre tipos de datos, las tareas de visualización y los tipos de gráficos.
Contenidos:
– Ejemplos históricos de visualización de datos.
– Conceptos fundamentales de visualización de información.
– Funciones básicas de matplotlib y seaborn.
– Modelo anidado de Munzner para diseño y validación de visualización.
– Reglas y recomendaciones generales para visualizaciones efectivas.
– Diseño e implementación de gráficos simples y avanzados para datos tabulares usando modelo anidado.
– Reducción de dimensionalidad.
– Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
– Visualización básica de datos de texto y datos espaciales.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Denis Parra
Profesor Asistente, Depto. de Ciencia de la Computación, Ingeniería UC
Fernando Florenzano
Magíster en Ciencias de la Ingeniería, PUC. Ingeniero Civil PUC.
Hernán Valdivieso
Profesor Instructor, Depto. de Ciencia de la Computación, Ingeniería UC