En los últimos años ha habido una explosión en la generación de datos y el interés por sacar partido a estos recursos. Aprende nuevas técnicas para manejar, analizar, entender y visualizar estos datos para tomar mejores decisiones.
A pesar de que existen muchas herramientas de software que ayudan en las tareas de análisis, comprensión y visualización de datos, se requieren capacidades para escribir pequeños trozos de código que permitan limpiar, transformar o implementar algoritmos para su manejo. Los lenguajes preferidos por los cientistas de datos para esta tarea son Python y R.
Este curso entrega las habilidades básicas para el trabajo con datos usando el lenguaje R, desde la adquisición de ellos desde archivos simples como bases de datos o páginas web, al análisis, visualización de los datos y construcción y evaluación de modelos de clasificación o clustering. El curso comienza con los elementos básicos del lenguaje de programación R que es el que se usa a lo largo de todos los contenidos, para pasar a la problemática de conseguir los datos desde fuentes diversas. Luego se estudia la visualización de los datos para terminar con la generación y evaluación de algunos de los modelos de minería de datos.
La metodología a utilizar es de clases en vivo en formato streaming, en las que se mezclarán clases teóricas y talleres prácticos aplicados.
Dirigido a:
- Profesionales que necesiten entender el ámbito de aplicación, oportunidades y desafíos del nuevo mundo que abre la Ciencia de Datos.
- Interesados en ingresar al área de Ciencia de Datos no solo como usarios de herramientas sino para participar en todo el proceso.
Objetivos de aprendizaje
- Aplicar las principales técnicas y herramientas para extraer y preparar los datos que serán utilizados por los algoritmos y herramientas de análisis. Del mismo modo aplicar las técnicas básicas de minería de datos para construir modelos de clasificación y regresión de modo de construir programas capaces de predecir o proyectar resultados futuros.
Al final del curso podrás:
- Escribir programas simples para manejo de datos usando el lenguaje R
- Escribir código que permita extraer datos desde archivos, bases de datos o páginas web
- Generar visualizaciones efectivas de los datos usando el lenguaje R
- Utilizar algunos de los modelos más utilizados en el área de minería de datos para construir clasificadores, identificar clusters o predecir comportamiento futuro de una variable
- Evaluar los méritos relativos de un modelo que será usado para clasificación o regresión
Contenidos:
- Elementos de programación en R
- Adquisición de datos desde archivos csv o json
- Interacción con bases de datos
- Adquisición mediante web scrapping
- Preparación de datos: limpieza y transformación
- Visualización de datos en R
- Reglas de asociación
- Algoritmos de clasificación
- Algoritmos de clustering
Selección y evaluación de modelos
¿Te gustó este programa?
¡Compártelo en tus redes sociales!