CURSO

ANÁLISIS DE DATOS CON HERRAMIENTAS DE BIG DATA


PRESENTACIÓN

Este curso aporta al estudiante las herramientas para el procesamiento de grandes volúmenes de datos que no es posible analizar con herramientas tradicionales como hojas de cálculo. El enfoque es 75% práctico y 25% teórico con ejercicios reales de proyectos de Big Data.

Para el desarrollo del curso, se utilizará el lenguaje python, librería pandas para la manipulación de datos y plotly para visualizar resultados; el enfoque será 100% en la nube con la herramienta gratuita Google Colaboratory, lo que permitirá desde cualquier computador acceder al material sin necesidad de un computador en específico.

JUSTIFICACIÓN

Las herramientas tradicionales para procesamiento de datos funcionan muy bien a una escala de 20.000 a 50.000 filas si hablamos de hojas de cálculo, pero cuando la información supera este límite es muy ineficiente tratar de analizarla extrayendo patrones al ver las tablas. Así mismo, tareas repetitivas como un cálculo estadístico básico exige que el usuario seleccione manualmente columnas lo que puede generar error para obtener resultados consolidados, cuando hablamos de dos o tres archivos podría ser eficiente con mucha práctica pero si hablamos de 100 o 1000 archivos donde se necesita realizar el cálculo es algo casi titánico.

Este curso brindará a los estudiantes herramientas computacionales que les permitan convertir datos en información e información en conocimiento, automatizar tareas donde se requieren unir muchos archivos filtrarlos hacer cálculos y mostrar los resultados; se utilizará la librería Pandas, la más utilizada para lectura y procesamiento de datos del lenguaje python y plotly como herramienta de visualización interactiva.

Se realizará una introducción de cómo el Big Data se convirtió rápidamente en una herramienta clave para el desarrollo mundial; posteriormente se realizará una introducción con las generalidades del lenguaje de programación donde se profundizará en el uso de la librería pandas y finalmente cómo mostrar los resultados con visualizaciones interactivas que servirán tanto en sus proyectos de investigación como en el desarrollo de sus carreras profesionales.

DESPLEGAR / REPLEGAR
Objetivos

Objetivo general:

Brindar herramientas a los estudiantes para el manejo, análisis y visualización de estructuras de datos con herramientas del lenguaje de programación python.

Objetivos Específicos:  

  • Hacer una introducción a los criterios del panorama del Big Data y cómo estas herramientas están al alcance de cualquier persona dado su contexto open source.
  • Hacer un repaso general del lenguaje de programación python en el entorno de trabajo de Google Colaboratory.
  • Enseñar el uso de la librería pandas, para cargar datos de diferentes orígenes, filtrar, transformar y guardar la información.
  • Enseñar el uso de la librería plotly para la presentación interactiva de resultados.
DESPLEGAR / REPLEGAR
Perfil del apirante

El curso está orientado para todas aquellas personas que posean un conocimiento básico de programación, que quieran manejar de manera eficiente volúmenes de datos que con herramientas tradicionales como las hojas de cálculo no se puedan analizar y que quieran adentrarse en el ámbito del análisis de datos.

DESPLEGAR / REPLEGAR
Metodología

Se propone una metodología virtual de seis horas a la semana, dividida en tres clases de dos horas donde los primeros 30 minutos son teóricos y se explica el tema a tratar, una hora donde se desarrollará de manera simultánea con los estudiantes el ejercicio de la aplicación con la herramienta Colaboratory, para que de esta manera realicen las preguntas y expresen las dificultades que pudieran tener en la resolución del problema; en los últimos 30 minutos se hace una introducción al tema de la siguiente clase y se propone un ejercicio para reforzar los conocimientos adquiridos.

Los set de datos y los notebooks con los que se trabajará en la clase estarán preparados con los enunciados para que el estudiante solo proponga la solución y los tenga como referencia para resolver problemas con las herramientas adquiridas en el curso.

DESPLEGAR / REPLEGAR
Competencias a desarrollar

Al finalizar el curso, los participantes estarán en capacidad de:

  • Comprender qué es y qué no el Big Data y su relación con el machine learning y la inteligencia artificial.
  • Extraer en un notebook de python los orígenes de datos más comunes, xls, csv, tsv, txt y bases de datos de mySQL.
  • Realizar transformaciones a los datos: filtrado, agrupaciones condicionales, unir diferentes archivos en uno solo con toda la información, manejar valores no disponibles y valores atípicos.
  • Realizar visualizaciones interactivas de los resultados de los análisis que permitan exponer de una manera gráfica sus conclusiones.
  • Utilizar el entorno de trabajo Google Colaboratory como herramienta de análisis.
DESPLEGAR / REPLEGAR
Requerimientos

Para tomar el curso, cada participante debe tener una cuenta de Google (correo electrónico con dominio @gmail.com) y una conexión estable a internet para conectarse en las clases virtuales.

DESPLEGAR / REPLEGAR
Más información

Oficina de Mercadeo y Admisiones

E-mails: educacion.continua@uamerica.edu.co

PBX: 3376680 Ext. 249, 149 y 156

PBX: 6580658 Ext. 670, 677, 656  y 650

(+57) 310 868 0919   (+57) 310 869 9046

(+57) 314 726 9388    (+57) 310 880 9757

EcoCampus de los Cerros: Avenida Circunvalar # 20 – 53

Tel: (601) 3376680 / Fax. (601) 3362441

Sede Norte: Calle 106 No 19-18

Tel: (601) 6580658

Bogotá D. C. , Colombia

Solicita más información vía celular o Whatsapp: whatsappwhatsapp

Compartir
SOLICITA MAYOR INFORMACIÓN








AUTORIZACIÓN ONLINE
SECCIÓN CONTÁCTENOS PÁGINA WEB WWW.UAMERICA.EDU.CO
Autorizo de manera voluntaria, previa, expresa e informada a LA FUNDACIÓN UNIVERSIDAD DE AMÉRICA identificada con NIT 860.006.806-7 y dirección electrónica notificaciones.judiciales@uamerica.edu.co en calidad de RESPONSABLE, para tratar mis datos personales de acuerdo con su Política de Tratamiento de Datos Personales.
LA FUNDACIÓN UNIVERSIDAD DE AMÉRICA queda autorizada para recolectar, compilar, almacenar, usar, circular, compartir, comunicar, procesar, actualizar, cruzar, transferir, transmitir, depurar, suprimir y disponer mis datos personales aquí suministrados, de acuerdo con las finalidades relacionadas con el objeto social de la Universidad y en especial para responder a mis inquietudes allegadas a través de este canal, y utilizar mis datos personales con la finalidad de mantener contacto y remitir información de interés. Finalmente declaro que la información y datos personales que he dispuesto para el tratamiento por parte de LA FUNDACIÓN UNIVERSIDAD DE AMÉRICA la he suministrado de forma voluntaria y es verídica.
Como titular de datos personales he sido informado de que la posibilidad de ejercer el derecho de consulta, queja o reclamo, así como la actualización, supresión o modificación de mis datos o cualquier derecho, dirigiendo de forma gratuita una Consulta y/o Comunicación en este sentido a la dirección electrónica: habeasdata@uamerica.edu.co o de forma presencial en el EcoCampus de Los Cerros, ubicado en la
Avenida Circunvalar No. 20 – 53 de la ciudad de Bogotá D.C., Colombia.

Acepto las condiciones

DESPLEGAR / REPLEGAR
CONTENIDO TEMÁTICO