CURSO
Tratamiento de Datos e Introducción a Machine Learning
PRESENTACIÓN
Este curso tiene como objetivo proporcionar herramientas avanzadas para el trata-miento de datos, facilitando su posterior análisis mediante técnicas básicas de Ma-chine Learning. Su enfoque será práctico, con ejercicios de programación en Python utilizando los frameworks pandas y sklearn, donde en cada clase se combinará una explicación teórica con la solución de un ejercicio aplicado. La preparación de datos es una de las principales actividades de los científicos de datos e ingenieros, repre-sentando más del 70% del tiempo en proyectos de Machine Learning, ya que los er-rores en el código suelen derivarse de un tratamiento inadecuado de los datos. Además, durante el análisis exploratorio, se pueden identificar patrones y caracte-rísticas inherentes antes de aplicar técnicas más avanzadas. Este curso está diseña-do para dotar a los participantes de herramientas que les permitan preparar conjun-tos de datos estructurados para su exploración y posterior análisis con técnicas bási-cas de Machine Learning, abordando algoritmos clásicos con un enfoque práctico, lo que permitirá obtener resultados de manera rápida y optimizar modelos para selec-cionar el que mejor describa el comportamiento del fenómeno analizado.
DESPLEGAR / REPLEGAR
Objetivos
Objetivo general:
Mostrar la preparación de datos como la etapa más importante antes de realizar cualquier análisis o plantear modelos de machine learning.
Objetivos Específicos:
- Hacer una introducción a los algoritmos de machine learning mediante el uso de la librería sklearn.
- Enseñar a los estudiantes a realizar un análisis exploratorio EDA y poder preparar los datos para algoritmos de machine learning mediante el framework pandas de Py-thon.
DESPLEGAR / REPLEGAR
Perfil del aspirante
Este curso está dirigido a profesionales, estudiantes y entusiastas del análisis de da-tos e inteligencia artificial que deseen fortalecer sus habilidades en el tratamiento de datos y en la implementación de técnicas básicas de Machine Learning utilizando Python. Se recomienda que los participantes tengan conocimientos fundamentales sobre el lenguaje Python, así como experiencia en la gestión de entornos virtuales con herramientas como Anaconda, Virtualenv o Poetry. También es conveniente con-tar con una comprensión básica de estadística descriptiva para interpretar adecua-damente las métricas de evaluación de modelos.
DESPLEGAR / REPLEGAR
Competencias previas
- Conocimientos basicos del lenguaje de programación python
- Conocimientos basicos en estadistica descriptiva
DESPLEGAR / REPLEGAR
Metodología
La metodología será muy práctica y enfocada en el desarrollo de software donde ca-da clase se verá una explicación teórica del tema a tratar con un ejemplo y su solu-ción en Python.
De igual manera, se propondrá un ejercicio corto para aplicar lo aprendido en la par-te teórica: el ejercicio se resolverá de manera participativa por los estudiantes y se resolverán todas las dudas en el mismo espacio.
DESPLEGAR / REPLEGAR
Contenidos
MÓDULO |
NOMBRE DEL MÓDULO |
CONTENIDO |
DURACIÓN |
1 |
Repaso de conceptos básicos de Python |
· Instalación de entorno Anaconda · Creación de entornos virtuales y el uso de los mismos · Programación en notebooks · Programación de scripts clases y métodos (conceptos básicos de programación orientada a objetos) · Tipos de datos en Python |
6H |
2 |
Manipulación de datos con pandas |
· Pandas como librería para manipulación de datos · Lectura de archivos desde diferentes fuentes, csv, xls, SQL, txt, json y lectura desde url · Manipulación básica para poder entender los datos que se leyeron en el apartado anterior · Visualizaciones básicas para entender el comportamiento estadístico básico de los datos · Reemplazo de valores faltantes o fuera de rango: entender el concepto de outlier · Creación de conjuntos y subconjuntos condicionados · Agrupaciones de datos y operaciones con datos agrupados · Agrupaciones de varias fuentes de datos para creación de una única fuente consolidada (en esta parte se verán las operaciones de conjuntos aplicadas a la manipulación de datos) · Correlación estadística
|
20H |
3 |
Aprendizaje supervision |
· Regresión lineal · Regresión lineal múltiple · Regresión logística · Árboles de decisión |
7H |
4 |
Aprendizaje no supervisado |
· Clustering · Análisis de componentes principales · Kmeans |
La Universidad de América se reserva el derecho de ajustar, cambiar o modificar el contenido del programa.
DESPLEGAR / REPLEGAR
Más Información
Atención para aspirantes: Tel: 57 601 6580658
E-mail: educacion.continua@uamerica.edu.co
EcoCampus de Los Cerros: Avenida Circunvalar # 20-53 (Ingreso por la avenida Circunvalar) Calle 19a # 5-20 Este (Ingreso por la Quinta de Bolívar) Sede Norte: Calle 106 # 19-18