Diplomado en Ciencia de datos para políticas públicas
(Iniciativa de la Escuela de Gobierno y el Instituto de Ingeniería Matemática y Computacional de la UC)
Conviértete en un experto en el análisis y producción de estudios, utilizando distintas fuentes de datos y metodologías de vanguardia.
Dirigido a profesionales de formación tanto científica, como humanista. Nuestro programa te brindará las herramientas necesarias para abordar los problemas más apremiantes de políticas públicas en la actualidad.
¡Inscríbete ahora y comienza tu viaje hacia el éxito profesional!

Antecedentes Generales
El concepto de políticas basadas en evidencia adquiere cada vez más relevancia en distintos sectores dedicados al análisis y diseño de políticas públicas, por lo resulta necesario contar con profesionales preparados para estos efectos.
Los alumnos de este diplomado aprenderán a evaluar qué tipo de datos son apropiados para determinadas necesidades, conocerán alcances y limitaciones de trabajos cuantitativos para la toma de decisiones en políticas públicas, comprenderán aspectos básicos para el análisis de datos complejos y no estructurados mediante herramientas estadísticas y computacionales, conocerán técnicas de visualización y comunicación de datos, e identificarán modelos para la evaluación de impacto de políticas públicas.
Tendrán las herramientas necesarias para saber cómo elaborar y encargar estudios a terceros que utilicen datos como su principal fuente de análisis, interpretar y leer estudios cuantitativos que utilicen datos complejos, y proponer análisis adecuados a distintos problemas en políticas públicas.
Profesionales que se desempeñen o busquen desempeñarse en instituciones públicas, ya sea instituciones del Estado, organizaciones no gubernamentales, academia, centros de investigación, entre otros. Deberán tener conocimiento de conceptos de estadística básica equivalentes a un curso introductorio de análisis de datos.
Formular preguntas de investigación e hipótesis para el análisis cuantitativo de datos, así como la preparación, curación, visualización datos y uso de los mismos en el entrenamiento de modelos de aprendizaje de máquina que aborden problemas de políticas públicas.
El alumno debe estar en posesión de un grado académico o de un título profesional universitario en alguna de las siguientes disciplinas: economía, ingeniería civil, ingeniería comercial, psicología, sociología, ciencias políticas, u otras disciplinas afines.
Se recomienda experiencia laboral de dos años en al área o áreas afines.
Contenidos del Programa
Al final del curso podrás:
− Identificar tipos de datos para distintas preguntas de investigación.
− Identificar ventajas y desventajas de distintos métodos empíricos.
− Aplicar métodos de ciencia de datos utilizando análisis estadístico.
Contenidos:
− Introducción a la programación para la política pública.
− Manipulación de datos.
− Web scrapping y APIs.
− Análisis de redes sociales.
− Análisis de datos geográficos.
− Análisis automatizado de texto.
Al final del curso podrás:
– Comprender el ciclo de vida del dato y su importancia en la investigación científica.
– Dominar el uso de R para la manipulación y análisis de datos.
– Aplicar el modelo entidad-relación en el diseño de bases de datos.
– Dominar el lenguaje SQL para consultas y manipulación de datos.
– Integrar R y SQL para realizar data wrangling y limpieza de datos.
– Evaluar y mejorar la calidad de los datos utilizando criterios como validez, exactitud, consistencia y completitud.
– Desarrollar habilidades para depurar datos de manera eficiente utilizando herramientas específicas.
Contenidos:
– Ciclo de vida del dato para la investigación científica.
– R para el manejo de datos.
– Modelo Entidad-Relación.
– Lenguaje de consulta SQL.
– Data wrangling: R + SQL.
– Dimensiones de calidad de datos: validez, exactitud, consistencia y completitud.
– Depuración de datos en R.
– Herramientas para depuración de los datos.
Al final del curso podrás:
– Comprender cuándo, cómo, y por qué las técnicas sofisticadas de análisis de datos pueden ser relevantes para tomar decisiones basadas en datos.
– Analizar datos para agruparlos según características comunes, descubrir patrones o anomalías en ellos, o detectar asociaciones.
– Aplicar métodos de clasificación y regresión basada en técnicas de machine learning para resolver problemas complejos sin necesidad de explicitar las instrucciones.
– Implementar formas eficaces de visualizar y comunicar los datos para la toma de decisiones.
Contenidos:
– Introducción: ejemplos y métodos de análisis y visualización de datos.
– Elementos de Teoría de Aprendizaje: selección de modelos, complejidad, generalización, descomposición del error y clasificación.
– Machine learning: redes neuronales, máquinas de soporte vectorial.
– Minería de datos: clustering, patrones más frecuentes, reglas de asociación.
– Visualización de datos: conceptos y tecnologías fundamentales.
Al final del curso podrás:
− Aplicar el concepto de escenario contrafactual para la evaluación de políticas públicas.
− Evaluar la calidad de la evidencia empírica presentada en distintos medios sobre el impacto de las principales políticas públicas en Chile.
− Identificar distintos métodos para preguntas de evaluación de impacto.
− Elaborar un diseño de evaluación de impacto de una política pública, utilizando al menos dos de los métodos revisados en clase.
− Presentar públicamente resultados de un ejemplo real de evaluación de impacto y presentar argumentos a favor y en contra de la calidad de la evaluación.
Contenidos:
− Regresión Bivariada.
− Regresión múltiple: sesgo por variable omitida.
− Variables instrumentales.
− Experimentos aleatorios y regresión discontinua.
− Matching y aprendizaje de máquina e inferencia causal.
Al final del curso podrás:
– Identificar una pregunta específica de investigación aplicada en políticas públicas.
– Formular hipótesis en el marco de una pregunta específica.
– Analizar bases de datos para una pregunta específica.
Contenidos:
Aplicaciones de:
− Manipulación de datos.
− Web scrapping y APIs.
− Análisis de redes sociales.
− Análisis de datos geográficos.
− Análisis automatizado de texto.
Al final del curso podrás:
– Integrar y aplicar de manera efectiva los conocimientos y habilidades adquiridos en los cursos de Gestión de Datos y Análisis y Visualización de Datos.
– Desarrollar habilidades de programación en R y SQL.
– Aplicar conocimiento a problemas del mundo real utilizando técnicas avanzadas de análisis de datos.
– Comunicar de manera efectiva los resultados del análisis a través de visualizaciones avanzadas e interactivas.
Contenidos:
– R para el manejo de datos.
– Transformación de datos.
– SQL.
– Integración de R y SQL.
– Algoritmos de regresión en R.
– Algoritmos de clasificación en R.
– Redes Neuronales en R.
– Evaluación de algoritmos de Machine Learning.
– Ajuste de hiperparámetros.
Cuerpo Docente
Jefe de Programa

Pablo Celhay
Profesor Asistente, Escuela de Gobierno UC. Fue consultor del Banco Mundial y del Banco Interamericano de Desarrollo.

Vicente Calisto Barría
Ingeniero Civil de Computación, UC. Experto en diseño, implementación y optimización de estructuras de datos y algoritmos.

Pablo Celhay
Profesor Asistente, Escuela de Gobierno UC. Fue consultor del Banco Mundial y del Banco Interamericano de Desarrollo.

Cristián Paris Ibarra
Coordinador de Transferencia Tecnológica y Educación Continua. Fue Subdirector en el Instituto de Ingeniería Matemática UC.

José Conejeros
Magíster en Sociología (c) y Estadística, UC. Investigador en temas de salud pública, cambio climático, pobreza y metodologías cuantitativas.

Francisco Alessandri Cuevas
Ingeniero Civil de Industrias, mención Ingeniería Matemática, UC. Investigador en temas cuantitativos en diferentes centros de estudios.