Manejo de grandes volúmenes de datos (Big Data) (online)
Comprende el manejo de grandes volúmenes de datos para obtener información valiosa que permita agilizar la toma de decisiones.
Está dirigido a un amplio rango de profesionales en las áreas de gestión, finanzas, comercial, marketing y en múltiples sectores desde salud, hasta la banca.
Este curso pertenece al Diplomado en Big Data para la toma de decisiones.
Antecedentes Generales
El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permiten agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. Dicha información proviene de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios. Este curso permite al alumno escoger las herramientas adecuadas para manejo de los datos en su empresa, entendiendo las infraestructuras computacionales que se requieren para manejar datos de distintos volúmenes y características.
Los contenidos serán abordados en 6 clases en línea (8 semanas), donde se entregarán los contenidos mediante recursos interactivos que integran videos, esquemas, artículos, lecturas y preguntas formativas. Lo anterior se realiza a través de una plataforma educativa virtual.
Profesionales a cargo de tomar decisiones y que observan potenciales beneficios en el uso de tecnologías relacionadas a Big Data, quienes buscan incrementar significativamente las ventajas competitivas en su organización. En particular, el curso está orientado a un amplio rango de profesionales en las áreas de gestión, finanzas, comercial, marketing y en múltiples sectores desde salud, hasta la banca. A quienes aporte valor en su quehacer el comprender cómo se manejan y organizan grandes volúmenes de datos para su posterior análisis y uso.
Analizar diversas fuentes de datos, seleccionando las infraestructuras computacionales apropiadas para el manejo de datos en el contexto organizacional.
Se recomienda poseer título profesional universitario o técnico, licenciatura o egreso de instituto profesional.
Se recomienda dominio básico de Excel y manejo de internet a nivel usuario.
Contenidos del Programa
Al final del curso podrás:
– Identificar las herramientas de manejo de datos adecuadas para el contexto de su empresa.
– Modelar datos usando herramientas de bases de datos relacionales (SQL), bases de datos NoSQL y bases de datos distribuidas.
– Estimar la necesidad de transición en la infraestructura de datos desde un modelo clásico centralizado (tipo SQL) hacia un modelo de Big Data distribuido.
Contenidos:
Manejo de datos
– Datos de una empresa.
– Distintos formatos de datos.
– Problemas organizacionales.
– Sistemas de bases de datos.
– Bases de datos relacionales.
¿Cómo interactuar con una base de datos?
– Base de datos en el ecosistema de una empresa.
– Lenguaje de consultas SQL.
– Múltiples usuarios trabajando con los datos.
Distribución de los datos
– Paso al mundo de Big Data.
– Distribución de los datos.
– Comparando sistemas centralizados y sistemas distribuidos.
NoSQL
– Otros modelos de datos.
– Key-value stores.
– Bases de datos de: documentos y grafos.
Procesamiento masivo de datos
– ¿Cómo manejar a datos diversos?.
– Sistema de archivos de Google.
– Google File System: Garantías de consistencia.
– ¿Cómo ocupar el sistema de archivos de Google?.
MapReduce
– ¿Cómo priorizar petabytes de datos?.
– MapReduce.
– Blocking y tolerancia a fallas.
– ¿Cómo ocupar MapReduce?.
Cuerpo Docente
Jefe de Programa
Cristián Paris Ibarra
Coordinador de Transferencia Tecnológica y Educación Continua
Domagoj Vrgoc
Doctor en Computación, Universidad de Edimburgo, Reino Unido