BASES DE DATOS PARA BIG DATA – Lenguaje R
Duracion:
30 Horas
Fechas:
16, 18, 19, 23, 25 y 26 de noviembre de 9 a 14 horas
Horario:
9:00 – 14:00
PROGRAMA
Operaciones básicas con R:
1. Cálculos simples.
2. Creación de variables.
3. Creación de vectores.
4. Consultas en vectores.
5. Transformación de formato.
6. Creación de listas.
7. Consultas en listas.
8. Creación de matrices.
9. Consultas en matrices.
10. Manipulación de matrices creadas.
11. Creación de factores.
12. Consultas en factores.
13. Creación de “Data Frames”.
14. Consultas en “Data Frames”.
15. Ejercicios prácticos.
Manipulación básica de datos en R:
1. Carga de bases de datos.
2. Manipulación de datos.
3. Creación de nuevas columnas/variables.
4. Manipulación de columnas/variables.
5. Cálculo de estadísticos básicos.
6. Consultas cruzadas.
7. Unión de varias tablas.
8. Operaciones con variables.
9. Muestra de datos.
10. Ejercicios prácticos.
Análisis preliminar de las variables:
1. Conocimiento básico de los datos.
2. Análisis de las variables.
3. Determinación de las diferentes clases de datos existentes.
4. Gráficos básicos de las variables individuales.
5. Gráficos básicos sobre las relaciones de las variables.
6. Gráficos avanzados sobre las relaciones entre las variables.
7. Gráficos avanzados sobre la correlación entre variables.
8. Interpretación de los gráficos.
Contrastes de Hipótesis:
1. Introducción a las distribuciones.
2. Introducción al contraste de hipótesis:
a. Hipótesis Nula.
b. Hipótesis Alternativa.
c. Estadístico del contraste.
d. P-Valor.
3. Tabla ANOVA.
4. Contraste de Tukey
Trabajando con fechas y variables:
1. Transformar una variable en formato fecha.
2. Descomposición de la fecha.
3. Cambio del nombre de las variables.
4. Reordenar el Data Frame.
Corrección de errores tipográficos:
1. Creación de un diccionario con las opciones correctas.
2. Corrección masiva de los errores.
3. Comprobación de las correcciones.
Extracción de datos estructurados:
1. Extracción de una tabla.
2. Extracción de varias tablas de una mima url.
3. Extracción y unión de varias tablas de distintas url.
4. Extracción automatizada y unión de varias tablas de distintas url.
5. Extracción y guardado de varias tablas de distintas url.
6. Extracción automatizada y guardado de varias tablas de distintas url.
Unión de tablas:
1. Unión de tablas similares vertical y horizontalmente.
2. Enriquecimiento de una tabla con información de otra.
3. Selección de los elementos comunes de varias tablas.
4. Selección de los elementos comunes y no comunes de varias tablas.
Filtrado:
1. Filtrado simple con variables no numéricas.
2. Filtrado simple por variables numéricas.
3. Filtrado compuesto por variables numéricas y no numéricas simultáneamente.
4. Filtrado por la clase de las variables.
5. Filtrado por el número de elementos diferentes de una variables.
6. Eliminación de duplicados.
7. FIltrado por las variables de otra tabla.
8. Filtrado por las filas de otra tabla.
9. Filtrado por los elementos de otra tabla.
10. Valores únicos.
Tratamiento avanzado de datos:
1. Extracción de los elementos de una fecha.
2. Adición del dia de la semana.
3. Modificación de variables en función de otras variables.
4. Agregaciones simples de datos.
5. Agregaciones de los datos por varias variables.
6. Gráficos avanzados de las agregaciones.
7. Unión de varias agregaciones.
8. Operaciones con variables.
9. Modificación de caracteres en variables.
10. Normalización simple de tablas.
11. Normalización compuesta de tablas.
12. Corrección de las normalizaciones.
13. Verticalización de tablas.
Programación horaria
16, 18, 19, 23, 25 y 26 de noviembre
- 9:00 - 14:00