BASES DE DATOS PARA BIG DATA – Lenguaje R
DURACION
- 30 horas.
- Fechas: 20, 21, 22, 23, 27 y 28 de marzo
- Horario: de 15 a 20 horas
PROGRAMA
Operaciones básicas con R:
- Cálculos
- Creación de variables.
- Creación de vectores.
- Consultas en
- Transformación de
- Creación de
- Consultas en
- Creación de matrices.
- Consultas en matrices.
- Manipulación de matrices creadas.
- Creación de
- Consultas en
- Creación de “Data Frames”.
- Consultas en “Data Frames”.
- Ejercicios prácticos.
Manipulación básica de datos en R:
- Carga de bases de datos.
- Manipulación de datos.
- Creación de nuevas columnas/variables.
- Manipulación de columnas/variables.
- Cálculo de estadísticos básicos.
- Consultas
- Unión de varias tablas.
- Operaciones con
- Muestra de
- Ejercicios prácticos.
Análisis preliminar de las variables:
- Conocimiento básico de los datos.
- Análisis de las variables.
- Determinación de las diferentes clases de datos existentes.
- Gráficos básicos de las variables individuales.
- Gráficos básicos sobre las relaciones de las variables.
- Gráficos avanzados sobre las relaciones entre las variables.
- Gráficos avanzados sobre la correlación entre variables.
- Interpretación de los gráficos.
Contrastes de Hipótesis:
- Introducción a las distribuciones.
- Introducción al contraste de hipótesis:
- Hipótesis Nula.
- Hipótesis Alternativa.
- Estadístico del contraste.
- P-Valor.
- Tabla ANOVA.
- Contraste de Tukey
Trabajando con fechas y variables:
- Transformar una variable en formato fecha.
- Descomposición de la fecha.
- Cambio del nombre de las variables.
- Reordenar el Data Frame.
Corrección de errores tipográficos:
- Creación de un diccionario con las opciones correctas.
- Corrección masiva de los errores.
- Comprobación de las correcciones.
Extracción de datos estructurados:
- Extracción de una tabla.
- Extracción de varias tablas de una mima url.
- Extracción y unión de varias tablas de distintas url.
- Extracción automatizada y unión de varias tablas de distintas url.
- Extracción y guardado de varias tablas de distintas url.
- Extracción automatizada y guardado de varias tablas de distintas url.
Unión de tablas:
- Unión de tablas similares vertical y
- Enriquecimiento de una tabla con información de
- Selección de los elementos comunes de varias
- Selección de los elementos comunes y no comunes de varias
Filtrado:
- Filtrado simple con variables no numéricas.
- Filtrado simple por variables numéricas.
- Filtrado compuesto por variables numéricas y no numéricas simultáneamente.
- Filtrado por la clase de las
- Filtrado por el número de elementos diferentes de una variables.
- Eliminación de
- FIltrado por las variables de otra
- Filtrado por las filas de otra
- Filtrado por los elementos de otra
- Valores únicos.
Tratamiento avanzado de datos:
- Extracción de los elementos de una fecha.
- Adición del dia de la
- Modificación de variables en función de otras
- Agregaciones simples de
- Agregaciones de los datos por varias
- Gráficos avanzados de las agregaciones.
- Unión de varias
- Operaciones con
- Modificación de caracteres en
- Normalización simple de tablas.
- Normalización compuesta de
- Corrección de las
- Verticalización de tablas
Operaciones básicas con R:
- Cálculos
- Creación de variables.
- Creación de vectores.
- Consultas en
- Transformación de
- Creación de
- Consultas en
- Creación de matrices.
- Consultas en matrices.
- Manipulación de matrices creadas.
- Creación de
- Consultas en
- Creación de “Data Frames”.
- Consultas en “Data Frames”.
- Ejercicios prácticos.
Manipulación básica de datos en R:
- Carga de bases de datos.
- Manipulación de datos.
- Creación de nuevas columnas/variables.
- Manipulación de columnas/variables.
- Cálculo de estadísticos básicos.
- Consultas
- Unión de varias tablas.
- Operaciones con
- Muestra de
- Ejercicios prácticos.
Análisis preliminar de las variables:
- Conocimiento básico de los datos.
- Análisis de las variables.
- Determinación de las diferentes clases de datos existentes.
- Gráficos básicos de las variables individuales.
- Gráficos básicos sobre las relaciones de las variables.
- Gráficos avanzados sobre las relaciones entre las variables.
- Gráficos avanzados sobre la correlación entre variables.
- Interpretación de los gráficos.
Contrastes de Hipótesis:
- Introducción a las distribuciones.
- Introducción al contraste de hipótesis:
- Hipótesis Nula.
- Hipótesis Alternativa.
- Estadístico del contraste.
- P-Valor.
- Tabla ANOVA.
- Contraste de Tukey
Trabajando con fechas y variables:
- Transformar una variable en formato fecha.
- Descomposición de la fecha.
- Cambio del nombre de las variables.
- Reordenar el Data Frame.
Corrección de errores tipográficos:
- Creación de un diccionario con las opciones correctas.
- Corrección masiva de los errores.
- Comprobación de las correcciones.
Extracción de datos estructurados:
- Extracción de una tabla.
- Extracción de varias tablas de una mima url.
- Extracción y unión de varias tablas de distintas url.
- Extracción automatizada y unión de varias tablas de distintas url.
- Extracción y guardado de varias tablas de distintas url.
- Extracción automatizada y guardado de varias tablas de distintas url.
Unión de tablas:
- Unión de tablas similares vertical y
- Enriquecimiento de una tabla con información de
- Selección de los elementos comunes de varias
- Selección de los elementos comunes y no comunes de varias
Filtrado:
- Filtrado simple con variables no numéricas.
- Filtrado simple por variables numéricas.
- Filtrado compuesto por variables numéricas y no numéricas simultáneamente.
- Filtrado por la clase de las
- Filtrado por el número de elementos diferentes de una variables.
- Eliminación de
- FIltrado por las variables de otra
- Filtrado por las filas de otra
- Filtrado por los elementos de otra
- Valores únicos.
Tratamiento avanzado de datos:
- Extracción de los elementos de una fecha.
- Adición del dia de la
- Modificación de variables en función de otras
- Agregaciones simples de
- Agregaciones de los datos por varias
- Gráficos avanzados de las agregaciones.
- Unión de varias
- Operaciones con
- Modificación de caracteres en
- Normalización simple de tablas.
- Normalización compuesta de
- Corrección de las
- Verticalización de tablas.
Programación horaria
20, 21, 22, 23, 27 y 28 de marzo
- De 15:00 - a 20:00
¡Agotado!