El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permiten agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. Dicha información proviene de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios. Este curso permite al alumno escoger las herramientas adecuadas para manejo de los datos en su empresa, entendiendo las infraestructuras computacionales que se requieren para manejar datos de distintos volúmenes y características.
Dirigido a:
Profesionales a cargo de tomar decisiones y que observan potenciales beneficios en el uso de tecnologías relacionadas a Big Data, quienes buscan incrementar significativamente las ventajas competitivas en su organización. En particular, el curso está orientado a un amplio rango de profesionales en las áreas de gestión, finanzas, comercial, marketing y en múltiples sectores desde salud, hasta la banca. A quienes aporte valor en su quehacer el comprender cómo se manejan y organizan grandes volúmenes de datos para su posterior análisis y uso.
Objetivos de aprendizaje
- Conocer las herramientas necesarias para transformar una empresa tradicional a una empresa que maneja datos de distinta complejidad.
- Analizar las distintas fuentes de los datos, e identificar las mejores infraestructuras computacionales para su manejo.
- Utilizar herramientas clásicas de manejo de los datos en el contexto de una organización.
- Datos de una empresa.
- Distintos formatos de datos.
- Problemas organizacionales.
- Sistemas de bases de datos.
- Bases de datos relacionales.
- Base de datos en el ecosistema de una empresa.
- Lenguaje de consultas SQL.
- Múltiples usuarios trabajando con los datos.
- Paso al mundo de Big Data.
- Distribución de los datos.
- Comparando sistemas centralizados y sistemas distribuidos.
- Otros modelos de datos.
- Key-value stores.
- Bases de datos de documentos.
- Bases de datos de grafos.
- ¿Cómo manejar a datos diversos?
- Sistema de archivos de Google.
- Google File System: Garantías de consistencia.
- ¿Cómo ocupar el sistema de archivos de Google?
- ¿Cómo priorizar petabytes de datos?
- MapReduce.
- Blocking y tolerancia a fallas.
- ¿Cómo ocupar MapReduce?