EXTRACCIÓN, PREPARACIÓN Y ALMACENAMIENTO DE LOS DATOS#
Introducción#
En esta asignatura vamos a conocer y profundizar la base metodológica para el desarrollo de aplicaciones de Big Data junto con las tendencias tecnológicas y conceptuales basadas en el almacenamiento y procesamiento de los datos.
La asignatura tiene como objetivo comprender y aplicar, con las tecnologías brindadas, las técnicas utilizadas en las actividades principales de las metodologías de Análisis de Datos que hoy son relevantes.
Contenidos mínimos#
Captura de datos. Fuente de datos. Captura de datos en la Web. Almacenamiento en bases de datos relacionales y no relacionales. Repositorios NoSQL. Depósitos de datos. Limpieza de datos. Lagos de datos.
Teoría#
El Proceso de Análisis de Datos incluye una serie de actividades, como las que podemos observar en la figura.
En esta asignatura nos abocaremos a las primeras 3 actividades:
El material teórico de cada uno de esas actividades esta disponible aquí:
A su vez en esta carpeta van a poder encontrar algunas plantillas con las operacones resumidas de las librerías y métodos mas utilizados.
Práctica#
Para el trabajo con la práctica, desde la Facultad de Informática les brindamos un entorno en jupyter el cual se accede con las credenciales brindadas. Para ingresar se debe utilizar la url: https://jupyter.fi.uncoma.edu.ar/.
A su vez, los prácticos realizados se deben subir a PEDCO (Curso EPA).
Los contenidos prácticos también se dividen en tres partes. Las dos primeras se refieren a la 1. Colección de Datos y 2. Preparación de Datos, y luego la última está relacionada a los aspectos a tener en cuenta para el 3. Almacenamiento de Datos.