calendar correo curso diplomado horas lugar modalidad in-company magister magisteres programa-avanzado quotes reloj telefono contacto contacto grad video
Escuela de Ingeniería
Coincidencias exactas
Buscar por
Seleccionar todos
Magisters
Diplomados
Cursos
Mooc
Profesores
Noticias
Páginas

Diplomado en Big Data y ciencia de datos

Herramientas para la producción, almacenamiento, procesamiento, análisis, interpretación y comunicación de grandes volúmenes de datos, para encontrar soluciones más exactas e innovadoras a muchos desafíos de las organizaciones.

Aprende en forma aplicada a tratar los datos para abrir nuevas oportunidades de negocio o crecimiento.

Antecedentes Generales

Próximamente (versión N°18)
Martes y jueves de 18:30 a 21:45 horas
296 horas totales (148 horas directas y 148 horas indirectas)
$2.500.000 en Chile / USD 2.778 resto del mundo ¡Consulta por descuento!

Todas las modalidades del programa (streaming, online y presencial) tienen el mismo valor. Además, recomendamos preguntar las condiciones de cada una al momento de matricularse.


programas@ing.puc.cl
(+56) 9 5504 4516 - (+56) 9 3353 0870

Para enfrentar los nuevos desafíos de datos, es necesario saber almacenar, administrar, procesar y analizar grandes cantidades de datos. La complejidad de los datos requiere nuevas y poderosas técnicas analíticas, por lo tanto, es crucial tener habilidades para comunicar e interpretar los resultados de este análisis. El manejo de estas habilidades cae bajo el dominio de los Data Scientists o Data Engineers profesionales que son altamente demandados por el mercado. El Diplomado en Big Data y Ciencias de Datos entrega competencias básicas para poder comenzar a trabajar con datos rápidamente o iniciarse en el camino hacia convertirse en un especialista en el futuro.

Las clases son de tipo expositivo y talleres aplicados con metodología hands on. Todas las actividades teóricas y prácticas buscan potenciar las habilidades de capacidad de análisis, toma de decisiones y el trabajo en equipo, a través de la presencia y participación del alumno en las sesiones de los cursos. El diplomado cuenta además con un seminario de introducción a big data, data science e inteligencia artificial.

Dirigido a:
- Profesionales que deseen enfrentarse al desafío de sacar el mejor provecho posible a datos de gran tamaño y complejidad, a través de nuevas e innovadoras técnicas, con el objetivo de impactar la toma de decisiones en sus negocios. Está orientado a profesionales como ingenieros, economistas, y otros profesionales licenciados y/o con experiencia en áreas afines, que requieren conocimientos y habilidades en la materia.

Resultado de aprendizaje general:
- Aplicar principios, y técnicas de modelamiento y visualización de la ciencia de datos para el análisis y solución de problemas de negocio.

Requisitos de ingreso
El alumno debe estar en posesión de un grado académico o de un título profesional universitario:
- Licenciatura en ciencias de la ingeniería o título de ingeniería civil.
- Otro grado académico o título profesional universitario en una disciplina afín, como ingeniería comercial, economía, agronomía, etc., cuyo nivel sea al menos equivalente al necesario para obtener el grado de licenciado.
- Experiencia laboral de dos años en al área o áreas afines.

Contenidos del Programa

Al final del seminario podrás:
- Identificar las principales diferencias Big Data, Data Science e inteligencia artificial y qué esperar de estos.
- Reflexionar sobre el impacto de estas tecnologías y técnicas en los negocios y la vida actual.

Contenidos:
- Tendencias tecnológicas y la estrategia: Big Data, IoT, análisis de datos, inteligencia artificial y Machine Learning.
- Big data: definiciones, arquitecturas , Map-Reduce, Hadoop, Spark.
- Bases de datos, Data Warehouses y Data Lakes.

Al final del curso podrás:
- Comprender las principales tecnologías asociadas a big data y reconocer bajo qué contexto utilizarlas.
- Diseñar arquitecturas de alto nivel en proyectos relacionados a Business Intelligence y Big Data.
- Generar ambientes de alta disponibilidad para proyectos de Data Science y Big Data.
- Identificar los conceptos de infraestructura Big Data en servicios de consumo on demand (servicios en la nube).

Contenidos:
- Tecnologías y servicios en la nube para BI, Big Data y Data Science.
- Procesamiento de datos eficiente con tecnologías Big Data.
- Diseño de arquitecturas de alta disponibilidad para BI y Big Data.
- Diseño y uso de infraestructura de alto rendimiento para algoritmos de Data Science.
- Estrategias y mejores prácticas en el desarrollo de componentes para arquitecturas de procesamiento masivo de datos.
- Diferencias entre soluciones de datos tradicionales y soluciones de Big Data.
- Gestión operativa de la infraestructura en un modelo de servicio continuo.

Al final del curso podrás:
- Revisar conceptos básicos de programación usando el lenguaje R.
- Usar el lenguaje R como una herramienta para analizar datos.
- Utilizar los sistemas gráficos de R para visualización de datos.
- Analizar conjuntos de datos utilizando los principios del análisis exploratorio de datos.
- Explicar la información visual contenida en los gráficos que generan R.
- Exponer los resultados de un análisis de datos.

Contenidos:
- Conceptos generales de programación en R: variables, estructuras de control, condicionales.
- Funciones y paquetes.
- Vectores y matrices.
- Listas.
- Data frames.
- Importación, limpieza y filtrado de datos.
- Dataframes: construcción y mezcla.
- Visualización gráfica.
- Análisis estadístico de datos con R: población y muestreo, tipos de datos, tablas de frecuencias, estadísticos descriptivos, coeficiente de posición y dispersión, errores de los procesos de medición, aplicaciones.
- Distribuciones de probabilidad.
- Regresión lineal con R.
- Regresión logística con R.
- Series de tiempo.

Al final del curso podrás:
- Identificar las principales teorías y prácticas de la emergente área de minería de datos.
- Desarrollar soluciones a problemas reales de big data y ciencia de datos que involucren la necesidad de técnicas de minería de datos.
- Implementar soluciones usando herramientas de software de minería de datos aplicándolas en datos reales.

Contenidos:
- Introducción: El concepto, el proceso y los problemas en que es relevante.
- Análisis de la canasta de mercado y reglas de asociación.
- Clasificación: Árboles de decisión, K-vecinos cercanos.
- Clustering: K-Means, Mean-Shift y Clustering aglomerativo.
- Selección de modelos (hold out, cross validation).

Al final del curso podrás:
- Identificar la importancia de la visualización de datos.
- Aplicar los conceptos fundamentales de las técnicas de visualización, comunicación y diseño efectivo.
- Manejar técnicamente los principales programas de visualizaciones.
- Exponer los datos de manera gráfica.
- Implementar reportes y tableros de manera efectiva.

Contenidos:
Unidad 1: Teoría sobre visualización de datos
- Introducción: breve historia, disciplinas de comunicación gráfica e importancia de visualizar datos.
- La “des-Excelización” y democratización de datos en la empresa.
- Condiciones necesarias para una visualización: datos y caso.
- Objetivos de la visualización: Contenido vs usuario, acceso, interacción y actualización.
- Fuentes de información: sistemas transaccionales, sistemas web, datos públicos.
- Preparación de datos: integridad, calidad, homologación.
- Generalidades sobre tipos de datos: medidas, dimensiones.
- Atributos a usar en una visualización.
- Análisis de los tipos de gráficos más comunes para representar datos.
- Exploración visual de datos.
- Indicadores, reportes y dashboards.
- Presentación de las herramientas principales del mercado.
- Visualizaciones avanzadas: scripting.

Unidad 2: Visualización de datos aplicada
- Datos de empresa: reportes transversales a industrias y vistas especificas.
- Revisión de casos de uso de dashboards generales.
- Revisión de casos de uso específicos por industrias.
- Revisión de casos de uso por niveles de usuarios: analistas vs C-level.

Al final del curso podrás:
- Evaluar oportunidades de negocio accionables a partir del análisis de datos.
- Aplicar los conceptos y métodos fundamentales de Data Science a problemas reales de negocio, interpretando adecuadamente los resultados y generando acciones de valor agregado.
- Desarrollar modelos descriptivos, predictivos y prescriptivos sobre datos de diversas industrias.

Contenidos:
- La evolución de la ciencia de datos y el análisis predictivo para el apoyo a la toma de decisiones.
- Las características que definen a una organización Data-Driven.
- Cómo las empresas modernas están generando productos y servicios analíticos.
- Metodologías de análisis de datos y búsqueda de patrones.
- Generación de modelos descriptivos, análisis de casos reales y trabajo práctico.
- Generación de modelos predictivos y prescriptivos, análisis de casos reales y trabajo práctico.
- Cómo interpretar modelos analíticos para tomar mejores decisiones de negocio.

Al final del curso podrás:
- Distinguir potencias y limitaciones del Machine Learning y Deep Learning para la resolución de problemas en diferentes industrias.
- Detectar situaciones y su contexto en las cuáles estas técnicas resolverían problemas de gran valor de negocio.
- Proponer un plan estratégico de desarrollo de tecnología basada en ciencia de datos, alineado con la estrategia corporativa.
- Utilizar modelos de redes neuronales profundas en contextos de visión computacional que sean capaces de detectar objetos e interpretar contenido de imágenes.
- Aplicar modelos de procesamiento de lenguaje natural para la resolución de problemas en textos no-estructurados de diferentes tipos y orígenes.

Contenidos:
Introducción, conceptos, gestión de datos
- Metodología de desarrollo de modelos (CRISP-DM, KDD, otros). Pre-procesamiento de datos.

Evaluación y selección de modelos
- Workflow de evaluación. Hold out, Cross Validation, refinamiento de hiper-parámetros. Métricas de evaluación. Accuracy, Precision, Recall, RMSE.

Modelos de aprendizaje automático supervisado
- Modelos de regresión numérica. Regresión Lineal y no-lineal. Modelos de clasificación, capacidades y características, así como ejemplos de aplicación. Entre los modelos: Árbol de Decisión, Random Forest, KNN, Naive Bayes, SVM, Redes Neuronales.

Modelos de aprendizaje no-supervisados
- K-Means, DBSCAN, HDBSCAN.

Modelos de aprendizaje profundo
- Introducción y conceptos esenciales. Ejemplos de aplicaciones en visión computacional y en procesamiento de lenguaje natural con modelos pre-entrenados (ej: YOLO). Características de las redes neuronales y conceptos básicos (álgebra lineal, funciones de mapeo). Diferentes topologías de redes profundas: FFN, Convolucional. Aplicación en contextos de información no-estructurada: procesamiento de video (visión computacional), procesamiento de texto natural (NLP y NLU), - Word Embedding, redes neuronales convolucionales. Modelos no-supervisados profundos: Autoencoders, GAN, y especialmente, Transformers y modelos generativos.

Nota: El orden de los cursos dependerá de la programación que realice la Subdirección Académica.

Cuerpo Académico

Testimonios


¿Te gusta esta publicación?

Comparte esta publicación


Diplomado en Big Data y ciencia de datos

Déjanos tus datos y recibe la información en tu correo:

Al momento de inscribirme autorizo a la Escuela de Ingeniería UC para mantener y tratar mis datos personales, todo conforme a la Ley Nº19.628, “Sobre Protección de la Vida Privada”. Revisa las Políticas UC aquí.
Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y términos del servicio de Google.

Webpay
Pago disponible con tarjetas de crédito de Chile hasta en 12 cuotas precio sin interés

 

40% Personas mayores de 60 años.
30% Exalumnos, colaboradores UC y DUOC, exalumnos de Educación Profesional de Ingeniería UC, Tarjeta vecino Providencia y Las Condes.
25% Convenio Ingeniería.
15% Funcionarios de servicios públicos.

Programas relacionados

Descargar Brochure
Necesitas ayuda? Conversemos