Herramientas para monitorear y analizar grandes volúmenes de datos, permitiéndote generar información optimizada para tomar decisiones estratégicas y mejorar la operación de las organizaciones. Este Diplomado UC es desarrollado junto el Centro de Formación Profesional.
El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permitan agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. El uso eficiente de dicha información requiere de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el diplomado.
Dirigido a:
Profesionales, ejecutivos o emprendedores que requieran tomar decisiones eficaces de gestión basado en los beneficios del uso de tecnologías relacionadas a Big-Data y con esto puedan incrementar significativamente las ventajas competitivas en la agilidad de su organización, área funcional o emprendimiento que tengan en curso. Así también, el diplomado está dirigido a los profesionales que requieran conocer los fundamentos de Big-Data para liderar proyectos de gestión que tengan como base el uso cuantitativo de información para así lograr tener una mejor precisión e impacto en la toma de decisiones de la empresa.
Introducción general al Big Data en una Compañía u Organización
- ¿Qué es?
- ¿Qué no es?
- ¿Quién está a cargo?
- ¿Qué debería hacer como Chief Data & Analytics Officer en mis primeros 90 días?
Cómo evaluar la aplicabilidad en la empresa, tipos de problemas de negocios, datos disponibles, ejemplos de caso de uso, armado de un caso de negocio
- ¿Qué proyectos son de interés?
- ¿Cuáles son los posibles?
- ¿Cómo se financian estos proyectos?
Data Science usando Big Data como deporte de equipo. Roles y funciones.
- ¿Cómo se arma un equipo de Data Science?
- Roles y responsabilidades.
- Habilidades necesarias
- Estrategia de crecimiento
- Administración de proyectos digitales
- Agile
Herramientas de Big Data – Arquitectura
- ¿Con qué herramientas se cuenta?
- Diferentes arquitecturas de Big Data: On premise, Cloud, Híbridos
Gobierno del Dato
- ¿Cómo se gobiernan los datos?
- ¿Cómo se protege la privacidad del dato y la seguridad?
- ¿Son los datos suficientes y representativos?
Modelos Analíticos y Herramientas
- ¿Cuáles son los diferentes tipos de modelos de machine learning?
- Herramientas: extracción de datos, entrenamiento de modelos, visualización
- ¿Cómo es el paso a producción?
Ejemplos de Casos de Uso, Nuevas Tendencias
Armado de una Evaluación Económica de un Caso de Uso
Preprocesamiento de Datos
- Calidad de datos
- Limpieza de datos
- Integración de datos
- Reducción de datos
- Transformación de datos
Métodos de Clasificación
- El proceso de clasificación
- Árboles de decisión
- Bayes ingenuo
- K-vecinos más cercanos
- Métodos conjuntos: Bagging, Boosting y Random Forests
Métodos de Agrupación
- Definición y propiedades
- Métodos de partición: K-means y K-medoides
- Métodos jerárquicos
Sistemas Recomendadores
- Impacto y casos importantes
- Filtrado colaborativo
- Filtrado basado en contenido
- Métodos híbridos
¿Qué es la Visualización de Datos?
- De qué trata la visualización
- Breve contexto
- Breve historia de la visualización
- Panorama de la visualización hoy
- Una definición operativa
¿Para qué sirve la Visualización de Datos?
- Visualización para amplificar el conocimiento
- Para qué nos sirve la visualización
- Qué queremos mostrar
- El proceso interactivo
¿Cómo trabajar la Visualización de Datos?
- Proceso de visualización
- Representación: percepción
- Representación: diseño y codificación visual
- Qué no hacer
- Evaluación
¿Cómo continuar la Visualización?
- Recomendaciones para profundizar
- Herramientas recomendadas
- Autores recomendados
- Recordando los objetivos de la visualización
Bases de Datos Relacionales
- Diversos fuentes de datos (Excel, CSV, texto plano, páginas web,…)
- Organización clásica de los datos: Bases de datos relacionales
- Lenguaje SQL
- Propiedades de una base de datos relacional: ACID
- Integración de los datos
Bases de Datos Distribuidas
- Paso al mundo de Big Data (limitaciones de una base de datos relacional)
- Un sistema distribuido
- Propiedades de sistemas distribuidos: CAP y BASE
- Limitaciones de sistemas distribuidos: ACID vs CAP
- Resolución de fallas en un sistema distribuido usando el consenso distribuido
Bases de Datos NoSQL
- Características de sistemas NoSQL
- Bases de datos de búsqueda: Amazon Dynamo
- Bases de datos de documentos: MongoDB
- Bases de datos de grafos: Neo4J
Procesamiento Masivo de Datos
- Distribución de los datos (Google distributed File System)
- Map-reduce
- Infraestructura de Apache Hadoop
- Apache Pig: lenguaje de scripting para Hadoop