Python y bases de datos (online)
Adquiere herramientas de programación para interactuar con diversas fuentes de datos, mediante el uso del lenguaje de programación Python y librerías asociadas.
Dirigido a profesionales con conocimientos de programación, que puedan o no estar involucrados en el área de Ciencia de Datos o simplemente interesados en aprender a interactuar con ellas.
Este curso forma parte de tres Diplomados: Diplomado en Python profesional, Diplomado en Python y ciencia de datos, y Diplomado en Ciencia de datos para la gestión.
Antecedentes Generales
El punto de partida para el trabajo de análisis de datos es obtenerlos desde las fuentes originales. Muchas veces están disponibles en forma de datasets ya preparados y compuestos por un conjunto de archivos de texto (csv, tsv, etc); otras veces es necesario conectarse con algún motor de bases de datos (MySQL, PostgreSQL, SQLServer, etc) y extraerlos directamente desde allí. En ocasiones es necesario transformar los datos extraídos para luego volver a cargar la data ya transformada, en otro motor de bases de datos que es usado para análisis (almacén de datos o data warehouse).
Los alumnos de este curso aprenderán los conceptos fundamentales asociados a las bases de datos, y a interactuar con un motor de bases de datos real, mediante el lenguaje standard SQL, para luego aprender cómo conectarse a un motor de bases de datos desde un programa Python para extraer y manipular la información. Finalmente, se aborda la interacción, también desde Python, con un motor de la categoría NoSQL como MongoDB o similar.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.
Profesionales que extraen o manipulan información desde motores de bases de datos.
Profesionales con conocimientos de programación, que puedan o no estar involucrados en el área de Ciencia de Datos o simplemente interesados en aprender a interactuar con ellas.
Desarrollar sistemas que interactúen con motores de bases de datos.
Conocimientos básicos de programación, específicamente en lenguaje Python. Manejo básico de Office e Internet. Tener conocimientos básicos sobre el manejo de programas computacionales en ambiente operativo Windows. Tener instalado en el computador un navegador como Explorer, Mozilla o Chrome.
Nota: Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python
Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
• MOOC Introducción a la Programación en Python I: Aprendiendo a programar con Python.
• Curso Herramientas de programación en Python para procesamiento de datos.
Contenidos del Programa
Al final del curso podrás:
– Describir las características de una base de datos relacional y una base de documentos.
– Interactuar directamente con un motor de bases de datos desde la herramienta de administración.
– Escribir consultas simples utilizando el lenguaje SQL.
– Formular consultas simples de una base de datos relacional mediante el lenguaje standard SQL.
– Construir programas Python que se conecten a un motor de bases de datos información.
Contenidos:
Conceptos y familiarización con ambiente de trabajo
– Conceptos fundamentales de bases de datos. El modelo relacional. MySQL desde el Workbench.
Crear una BD simple con solo dos tablas y poblarla con información
– Introducción al lenguaje SQL. Creación de una base de datos desde Python. Tablas y tipos de datos. Creación de tablas desde Python. Agregar y eliminar información a una tabla desde Python.
SQL y Dataframes
– Introducción a Pandas y Dataframes. SQL joins. Transacciones en bases de datos. Eliminación y modificación de filas en una tabla.
Extracción de información más sofisticada de la BD con consultas más complejas y trabajo con Dataframes
– Operaciones de conjunto y cláusulas de agrupación. Ordenamiento y agrupación. Carga de contenido csv desde una API Web. Procesamiento de un archivo en formato csv.
Bases de datos NoSQL de documentos, MongoDB y JSON
– Bases de datos NoSQL. Introducción a MongoDB. El formato JSON. MongoDB desde Python.
Extraer y procesar información JSON desde una BD MongoDB y desde una API en la Web y procesarla con un programa Python
– Conectando con MongoDB. Interactuando con el motor MongoDB desde un programa. Procesamiento de JSON desde Python. Extracción de JSON desde una API Web.
Cuerpo Docente
Jefe de Programa
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC
Jaime Navón Cohen
Profesor Asociado del Departamento de Ciencia de la Computación UC