Diplomado en Python y ciencia de datos (online)

Programación y manejo de datos para introducirse en las áreas de la Ciencia de Datos y Machine Learning utilizando Python.

Python es un lenguaje versátil y con una enorme capacidad de lograr cualquier objetivo propuesto, gracias a la existencia de un sinfín de librerías abiertas en la Web.

Abierto a todo tipo de profesionales pues no requiere conocimientos previos de programación (se entregan en el primer curso).

La metodología online consiste en herramientas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Diplomado en Python y ciencia de datos (online)

Antecedentes Generales

  • Fecha de inicio

    26 de noviembre

  • Horas

    300 horas totales (140 horas directas y 160 horas indirectas)

  • Valor

    $2.190.000 en Chile / USD 2.433 resto del mundo ¡Consulta por descuento!

  • Tutor de apoyo permanente

  • 4 clases sincrónicas

  • Cuestionarios de selección múltiple

  • Proyectos aplicados

  • Material multimedia de apoyo

Python se ha convertido en la herramienta fundamental para los profesionales que trabajan en Ciencia de Datos e Inteligencia Artificial. Hay muchos programas de Ciencia de Datos en que se da por sentado que uno sabe Python, o que lo aprenderá al mismo tiempo que aprende los contenidos del programa. Este diplomado ofrece un camino distinto: dedicar todo el esfuerzo al comienzo en aprender a usar este lenguaje, partiendo desde cero, para luego aprender la forma en que se interactúa con bases de datos, y finalmente cómo se le puede sacar el máximo partido en el contexto de Ciencia de Datos.

Este enfoque tiene dos ventajas importantes. Primero, que entrega las competencias necesarias para usar Python más adelante en otros escenarios y áreas de aplicación y, segundo, que no exige al estudiante el tener que aprender Python al mismo tiempo que las técnicas y los algoritmos.

El formato del Diplomado en Python y Ciencia de Datos es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de ciencia de datos a su trabajo.

Profesionales que necesiten o estén interesados en aprender a programar usando el lenguaje Python y aplicarlo a la extracción y análisis de datos.

Desarrollar programas de mediana complejidad utilizando el lenguaje Python para interactuar con bases de datos y crear soluciones en el ámbito de la inteligencia artificial.

No tiene requisitos académicos.

Se recomienda dos años de experiencia laboral.

Es deseable contar con algún grado de conocimiento matemático (algebra lineal, estadística básica y cálculo).

Contenidos del Programa

Al final del curso podrás:
– Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
– Utilizar los comandos de control de flujo y los ciclos para la dirigir y repetir eficientemente un conjunto de operaciones básicas.
– Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos.
– Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
– Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.

Contenidos:
Introducción a la programación: Motivación: de los datos a la información, datos, información y programación ¿Cómo conviven hoy estos elementos en el mundo laboral?, ¿qué es la programación?, aplicaciones prácticas, la programación en el mundo laboral y cómo debe convertirse en un hábito. Secuencias de comandos en Python. Operaciones básicas. Creación y asignación de variables. Operaciones lógicas.

Control de flujo: Control de flujo: If, Else, Elif, uso en conjunto. Ciclos: While, For.

Tipos de datos y funciones: Tipos de datos: enteros, decimales, textos y listas. Strings: ¿Qué es un string?, funciones básicas y avanzadas de un string. Funciones: ¿Qué es una función?, ¿por qué ocupar funciones?, declaración y uso de funciones. Listas: creación de listas, obtener elementos, añadir elementos o quitar elementos, operaciones sobre listas.

Procesamiento de datos: Listas de listas. Archivos: cómo se interactúa con archivos y para qué sirven, leer y escribir archivos. Procesamiento de datos: carga y edición masiva, ejemplos prácticos.

Diccionarios y tuplas: Listas y listas de listas. Manipulación de listas. Funciones sobre listas. Diccionarios. Operaciones y aplicaciones de diccionarios. Aplicaciones con listas y diccionarios. Tuplas como tipo de dato inmutable. Operaciones sobre tuplas. Combinando listas, tuplas y diccionarios.

Funciones: Concepto de función. Definición de funciones. Parámetros y valores de retorno. Importación y llamado de módulos. Invocación de funciones y scope. Parámetros con nombre y parámetros por defecto. Funciones recursivas. Aplicación de funciones.

Al final del curso podrás:
– Utilizar las estructuras de datos secuenciales y no secuenciales más adecuadas en cada caso.
– Construir un programa utilizando los conceptos de la programación orientada a objetos.
– Incorporar funcionalidades disponibles en bibliotecas existentes a un programa propio.

Contenidos:
– Introducción al lenguaje de programación Python y su sintaxis.
– Estructuras de datos secuenciales: listas, tuplas, colas.
– Estructuras de datos no secuenciales: diccionarios y sets.
– Clases, objetos, atributos y métodos.
– Interacción entre objetos.
– Uso de módulos y bibliotecas existentes.

Al final del curso podrás:
– Describir las características de una base de datos relacional y una base de documentos.
– Interactuar directamente con un motor de bases de datos desde la herramienta de administración.
– Escribir consultas simples utilizando el lenguaje SQL.
– Agregar, eliminar información y formular consultas simples de una base de datos relacional mediante el lenguaje standard SQL.
– Construir programas Python capaces de conectarse a un motor de bases de datos para extraer o registrar información.

Contenidos:
Conceptos y familiarización con ambiente de trabajo
– Conceptos fundamentales de bases de datos. El modelo relacional. MySQL desde el Workbench.

Crear una BD simple con solo dos tablas y poblarla con información
– Introducción al lenguaje SQL. Creación de una base de datos desde Python. Tablas y tipos de datos. Creación de tablas desde Python. Agregar y eliminar información a una tabla desde Python.

SQL y Dataframes
– Introducción a Pandas y Dataframes. SQL joins. Transacciones en bases de datos. Eliminación y modificación de filas en una tabla .

Extracción de información más sofisticada de la BD con consultas más complejas y trabajo con Dataframes
– Operaciones de conjunto y cláusulas de agrupación. Ordenamiento y agrupación. Carga de contenido csv desde una API Web. Procesamiento de un archivo en formato csv.

Bases de datos NoSQL de documentos, MongoDB y JSON
– Bases de datos NoSQL. Introducción a MongoDB. El formato JSON. MongoDB desde Python.

Extraer y procesar información JSON desde una BD MongoDB y desde una API en la Web y procesarla con un programa Python
– Conectando con MongoDB. Interactuando con el motor MongoDB desde un programa. Procesamiento de JSON desde Python. Extracción de JSON desde una API Web.

Al final del curso podrás:
– Identificar las principales teorías y prácticas de la Minería de Datos.
– Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones.
– Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales.

Contenidos:
– Conceptos sobre Data Warehouse y uso de Dataframes .
– Procesamiento y consolidación de datos: preprocesamiento de datos, selección y transformación de datos.
– Reglas de asociación.
– Aplicación de los algoritmos Random Forest y KNN: árbol de decisión, KNN, Random Forest.
– Aplicación de los algoritmos K-Means y DBSCAN: Clustering, K-Means, Clustering jerárquico.
– Introducción al Machine Learning: modelo de entrenamiento, métricas de evaluación.

info Para poder avanzar a los cursos 2, 3 y 4, el estudiante debe haber aprobado el curso Herramientas básicas de programación en Python

Cuerpo Docente

Jefe de Programa

Jaime Navón Cohen

Profesor Asociado del Departamento de Ciencia de la Computación UC

Mauricio Arriagada

Doctor en Ciencias de la Ingeniería UC

Jaime Navón Cohen

Profesor Asociado del Departamento de Ciencia de la Computación UC

Antonio Ossa Guerra

Ingeniero en Machine Learning de PhageLab

Felipe López Rojas

Magíster en Ciencias de la Ingeniería


¿te gusta esta publicación?
Comparte esta publicación