COLUMNA DE OPINIÓN
Pablo Celhay, Doctor y Magíster en Políticas Públicas, Universidad de Chicago. Jefe del Diplomado en Ciencia de Datos para Políticas Públicas. Iniciativa de la Escuela de Gobierno y el Instituto de Ingeniería Matemática y Computacional de la UC.
Hoy el mundo descansa bajo una nube de datos e información que crece a gran volumen y sin una estructura común. A simple vista, la lluvia de datos puede parecer caótica y ruidosa, pero esta esconde patrones útiles para explicar fenómenos sociales. Darle estructura y sentido a estos datos es uno de los desafíos de la Ciencia de Datos.
Un ejemplo notable es el de Blumenstock, Cadamuro, & On (2015) quienes estiman mapas de pobreza en Ruanda. Típicamente las estadísticas de pobreza vienen de encuestas sociales como la encuesta CASEN en Chile. Sin embargo, la mayoría de las encuestas no permiten hilar fino ya que, si bien son buenos instrumentos para explicar fenómenos poblacionales, no son muy útiles para describir estos mismos fenómenos en zonas geográficas de mayor granularidad, pues la mayoría son representativas para un país o macro zonas dentro de este país. Entonces, ¿cómo generar datos de pobreza o de ingresos dónde no existen? Los autores del estudio tomaron datos de una muestra aleatoria de usuarios de telefonía celular de la compañía más grande del país e hicieron una encuesta básica rescatando información sociodemográfica y de ingresos. Pero además de esta información, típica de encuestas, los autores contaban con datos sobre la intensidad de uso del teléfono para cada uno de los participantes de la encuesta. Combinando estos datos, entrenaron un modelo predictivo de intensidad de uso e ingresos de las familias utilizando técnicas de aprendizaje de máquina. Con esto extrapolaron los resultados al más de un millón de usuarios de la compañía, obteniendo datos de ingresos de todos estos usuarios en base a la intensidad de uso de teléfono y así construir indicadores de ingreso y pobreza a lo largo del área en dónde la compañía de teléfonos operaba. Replicando esta información en el tiempo permite hacer un monitoreo de indicadores de pobreza a niveles más desagregados y estudiar la incidencia de distintas políticas sobre este indicador.
Las técnicas de Ciencias de Datos también se utilizan para analizar información en bases aisladas que no tienen mucho sentido por si solas pero que al combinarlas generan una riqueza de conocimiento e información. En Chile, existen datos de alto volumen que se actualizan con una periodicidad frecuente y con un gran potencial para poder apoyar la toma de decisiones en sectores estratégicos para el desarrollo económico y social como Salud, Educación, Vivienda, Medio Ambiente, Crimen, entre otros. Un ejemplo son los datos de la actual pandemia del Covid19. Las autoridades nos informan de la evolución diaria de nuevos casos, las tasas de vacunación, las tasas de positividad, e informan semanalmente sobre decisiones de mitigación que se alimentan de estos datos y bases y de la asociación que tienen las políticas de mitigación y sus consecuencias en la evolución de la pandemia.
El concepto de políticas basadas en evidencia adquiere cada vez más relevancia en distintos sectores dedicados a el análisis y diseño de políticas públicas, por lo que se hace necesario contar con profesionales preparados para estos efectos. En el Diplomado en Ciencia de Datos para Políticas Públicas, los estudiantes aprenderán a evaluar qué tipo de datos son apropiados para qué tipo de necesidades, conocerán alcances y limitaciones de trabajos cuantitativos para la toma de decisiones en políticas públicas, comprenderán aspectos básicos para el análisis de datos complejos y no estructurados mediante herramientas estadísticas y computacionales, conocerán técnicas de visualización y comunicación de datos, e identificarán modelos para la evaluación de impacto de políticas públicas.
Profesionales de las políticas públicas y personas que investigan en áreas relacionadas a las Ciencias Sociales están experimentando el cambio en la era digital y se hace cada vez más necesario actualizarse en las nuevas técnicas de análisis de datos y su alcance técnico y ético. Este cambio no significa que todo lo que hacemos hoy en Ciencia de Datos es nuevo ya que varios principios del análisis de datos “tradicional” se utilizan en estas nuevas herramientas. La invitación es a innovar y combinar nuestro conocimiento con las oportunidades que nos ofrece los avances en tecnologías de información desde una mirada interdisciplinaria entre la computación y las ciencias sociales.
Te invitamos a conocer el Diplomado en Ciencia de Datos para Políticas Públicas UC. Inicio de clases: 4 de octubre de 2021. Consulta por descuento y facilidades de pago.