El punto de partida para el trabajo de análisis de datos es obtenerlos desde las fuentes originales. Muchas veces están disponibles en forma de datasets ya preparados y compuestos por un conjunto de archivos de texto (csv, tsv, etc); otras veces es necesario conectarse con algún motor de bases de datos (MySQL, PostgreSQL, SQLServer, etc) y extraerlos directamente desde allí. En ocasiones es necesario transformar los datos extraídos para luego volver a cargar la data ya transformada, en otro motor de bases de datos que es usado para análisis (almacén de datos o data warehouse).
Los alumnos de este curso aprenderán los conceptos fundamentales asociados a las bases de datos, y a interactuar con un motor de bases de datos real, mediante el lenguaje standard SQL, para luego aprender cómo conectarse a un motor de bases de datos desde un programa Python para extraer y manipular la información. Finalmente, se aborda la interacción, también desde Python, con un motor de la categoría NoSQL como MongoDB o similar.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.
Dirigido a:
- Profesionales que extraen o manipulan información desde motores de bases de datos.
- Profesionales con conocimientos de programación, que puedan o no estar involucrados en el área de Ciencia de Datos o simplemente interesados en aprender a interactuar con ellas.
Objetivo:
- Desarrollar sistemas que interactúen con motores de bases de datos.
Requisitos de ingreso:
Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python
Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
– MOOC “Introducción a la Programación en Python I: Aprendiendo a programar con Python”, disponible en el siguiente link: https://www.coursera.org/learn/aprendiendo-programar-python
– Curso “Herramientas de programación en Python para procesamiento de datos”, disponible en el siguiente link: https://teleduc.uc.cl/curso/herramientas-programacion-python-procesamiento-datos/ .
- Conceptos fundamentales de bases de datos
- El modelo relacional
- MySQL desde el Workbench
- Introducción al lenguaje SQL
- Creación de una base de datos desde Python
- Tablas y tipos de datos
- Creación de tablas desde Python
- Agregar y eliminar información a una tabla desde Python
- Introducción a Pandas y Dataframes
- SQL joins
- Transacciones en bases de datos
- Eliminación y modificación de filas en una tabla
- Operaciones de conjunto y cláusulas de agrupación
- Ordenamiento y agrupación
- Carga de contenido csv desde una API Web
- Procesamiento de un archivo en formato csv
- Bases de datos NoSQL
- Introducción a MongoDB
- El formato JSON
- MongoDB desde Python
- Conectando con MongoDB
- Interactuando con el motor MongoDB desde un programa
- Procesamiento de JSON desde Python
- Extracción de JSON desde una API Web
¿Te gusta esta publicación?
Comparte esta publicación
*El profesional debe cumplir con los requisitos de admisión para postular a un curso.
*Beneficios sólo aplican a los programas de Educación Profesional de la Escuela de Ingeniería y excluyen a La Clase Ejecutiva, y a los diplomados articulables con los programas de magíster.