calendar correo curso diplomado horas in-company magister magisteres programa-avanzado quotes reloj telefono contacto contacto grad video

Diplomado en Big Data y Ciencia de Datos



El mercado requiere profesionales capaces de comprender e interpretar grandes cantidades de información. Especialízate en el tratamientos de los datos para mejorar las estrategias y crear oportunidades de negocios.



El Diplomado en Big Data y Ciencias de Datos para Negocios aborda herramientas para trabajar con grandes volúmenes de datos, a través del tratamiento y análisis de la información, permitiendo una adecuada interpretación y comunicación de los resultados.

 

Las clases son tanto expositivas, como aplicadas, donde los alumnos utilizan las herramientas en diversos talleres que se realizan. Todas las actividades buscan potenciar las habilidades analíticas, estratégicas y toma de decisiones con datos en cualquier organización, además del trabajo en equipo.

 

Dirigido a:
Profesionales que deseen enfrentarse al desafío de sacar el mejor provecho posible a datos de gran tamaño y complejidad, a través de nuevas e innovadoras técnicas, con el objetivo de impactar la toma de decisiones claves en sus negocios. Está orientado a profesionales como ingenieros, economistas, estadísticos, y otros profesionales licenciados y/o con experiencia en áreas afines.

 






Antecedentes Generales

  • Versión 3°: Próximamente
    Lugar de realización: Campus San Joaquín, metro San Joaquín

  • Lunes y miércoles de 18:30 a 21:45 horas.

  • 148 horas cronológicas.
  • $2.900.000.-
  • programas@ing.puc.cl
    +56 2 2354 4516

SEMINARIO: INTRODUCCIÓN A BIG DATA, DATA SCIENCE E INTELIGENCIA ARTIFICIAL
– Tendencias Tecnológicas y la estrategia: Big Data, IoT, Análisis de Datos, Inteligencia Artificial y Machine Learning
– Big Data: Definiciones, arquitecturas , Map-Reduce, Hadoop, Spark
– Bases de Datos, Data Warehouses y Data Lakes

ARQUITECTURA E INFRAESTRUCTURA PARA BIG DATA Y DATA SCIENCE
– Tecnologías y servicios en la nube para BI, Big Data y Data Science
– Procesamiento de datos eficiente con tecnologías Big Data
– Diseño de arquitecturas de alta disponibilidad para BI y Big Data
– Diseño y uso de infraestructura de alto rendimiento para algoritmos de Data Science
– Estrategias y mejores prácticas en el desarrollo de componentes para arquitecturas de procesamiento masivo de datos
– Diferencias entre soluciones de datos tradicionales y soluciones de Big Data
– Gestión operativa de la infraestructura en un modelo de servicio continuo

PROGRAMACIÓN EN R PARA CIENCIA DE DATOS
– Conceptos generales de programación en R: variables, estructuras de control, condicionales
– Funciones y paquetes
– Vectores y Matrices
– Listas
– Data Frames
– Importación, limpieza y filtrado de datos
– Dataframes: construcción y mezcla
– Visualización gráfica
– Análisis estadístico de datos con R: población y muestreo, tipos de datos, tablas de frecuencias, estadísticos descriptivos, coeficiente de posición y dispersión, errores de los procesos de medición, aplicaciones
– Distribuciones de probabilidad
– Regresión lineal con R
– Regresión logística con R
– Series de tiempo

MINERÍA DE DATOS
– Introducción: El concepto, el proceso y los problemas en que es relevante
– Análisis de la canasta de mercado y reglas de asociación
– Clasificación: Árboles de Decisión, K-vecinos cercanos
– Clustering: K-Means, Mean-Shift y Clustering aglomerativo
– Selección de modelos (hold out, cross validation

VISUALIZACIÓN DE DATOS
Unidad 1 Teoría sobre Visualización de Datos
– Introducción: breve historia, disciplinas de comunicación gráfica e importancia de visualizar datos
– La “des-Excelización” y democratización de datos en la empresa
– Condiciones necesarias para una visualización: datos y caso
– Objetivos de la visualización: contenido vs usuario, acceso, interacción y actualización
– Fuentes de información: sistemas transaccionales, sistemas web, datos públicos
– Preparación de datos: integridad, calidad, homologación
– Generalidades sobre tipos de datos: medidas, dimensiones
– Atributos a usar en una visualización
– Análisis de los tipos de gráficos más comunes para representar datos
– Exploración visual de datos
– Indicadores, Reportes y Dashboards
– Presentación de las herramientas principales del mercado
– Visualizaciones avanzadas: scripting

Unidad 2:  Visualización de Datos Aplicada
– Datos de empresa: reportes transversales a industrias y vistas específicas
– Revisión de casos de uso de Dashboards generales
– Revisión de casos de uso específicos por industrias
– Revisión de casos de uso por niveles de usuarios: analistas vs C-level

CIENCIA DE DATOS Y SUS APLICACIONES
– La evolución de la ciencia de datos y el análisis predictivo para el apoyo a la toma de decisiones
– Las características que definen a una organización data-driven
– Cómo las empresas modernas estás generando productos y servicios analíticos
– Metodologías de análisis de datos y búsqueda de patrones
– Generación de modelos descriptivos, análisis de casos reales y trabajo práctico
– Generación de modelos predictivos y prescriptivos, análisis de casos reales y trabajo práctico
– Cómo interpretar modelos analíticos para tomar mejores decisiones de negocio

FUNDAMENTOS Y APLICACIONES DE MACHINE LEARNING Y DEEP LEARNING
Aprendizaje Automático Supervisado
– Modelos de ML, capacidades y características, así como ejemplos de aplicación.
– Metodología de desarrollo de modelos
– Tratamiento y refinamiento de datos

Aprendizaje Profundo Supervisado
– Conceptos esenciales y diferencias con ML más básico
– Redes Neuronales Convolucionales y Redes Neuronales Recurrentes
– Análisis dimensional, entrenamiento, y tratamiento de grandes datos

Aprendizaje Automático No-Supervisado
– Diferentes modelos como K-Means, HDBSCAN, Restricted Boltzmann Machines, entre otros

Aplicaciones Industriales
– Clasificación, predicción, y recomendación, en contextos industriales y retail
– Procesamiento de lenguaje natural, en atención de clientes y ámbito legal

El futuro Inmediato en ML y DL
– Hacia el razonamiento artificial

Nota: El orden de los cursos dependerá de la programación que realice la Dirección Académica.

Jefe de Programa

  • Jaime Navón Cohen
    Profesor Asociado Ciencia de la Computación UC Ver ficha

Profesores

  • Mauricio Arriagada
    Doctor en Ciencias de la Ingeniería UC Ver ficha
  • Néstor Campos
    Gerente de Proyectos Estratégicos y Jefe de Arquitectura de Soluciones en Metric Arts Ver ficha
  • Jaime Caiceo Duque
    Profesor Instructor Adjunto Departamento de Ciencias de la Computación UC Ver ficha
  • Matías Casassus
    Gerente de Data Science en Tiaxa Ver ficha
  • Miguel Jorquera Viguera
    Líder Técnico del área de Data Science, Metric Arts Ver ficha
  • Jaime Navón Cohen
    Profesor Asociado Ciencia de la Computación UC Ver ficha
  • Rodrigo Sandoval
    CEO y fundador de R: Solver Ver ficha

Solicita información y brochure aquí:

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y términos del servicio de Google.

¿Listo para postular?

Postula Aquí

 

¿Te gustó este programa?
¡Compártelo en tus redes sociales!

X