MACHINE LEARNING CON R (Subvencionado)
DURACION:
30 Horas
Fechas: 15, 17, 19, 22, 24 y 26 de noviembre de 9 a 14 horas
PROGRAMA
Outliers:
· Definición.
· Problemas de su no tratamiento.
· Detección de outliers:
o Gráficamente.
o Extracción de los outliers.
o Determinación de las observaciones que incluyen outliers.
o Extracción de los valores de los outliers.
· Tratamiento de los outliers:
o Eliminación de las observaciones.
o Transformación en NAs.
o Creación de nuevas variables dummy de forma masiva.
o Tratamiento individualizado.
Valores perdidos:
· Cuantificación de los valores perdidos:
o Total.
o Por variables.
o Por observaciones.
· Análisis gráfico de los valores perdidos.
· Eliminación de los valores perdidos variable por variables.
· Eliminación masiva de los valores perdidos.
· Eliminación de variables con alto porcentaje de valores perdidos.
· Imputación por valores estadísticos (media, moda, mediana)
· Métodos de imputación múltiple.
· Creación de modelos para la imputación.
Estadísticos básicos: Cálculo e interpretación de la:
· Media.
· Mediana.
· Moda
· Varianza.
· Covarianza.
· Correlación.
Regresión como base de la modelización:
· Regresión lineal simple.
· Regresión lineal general.
· Regresión polinómica.
· Regresión logística.
· Error Cuadrático Medio y Error Absoluto.
· Estimación de la recta de regresión.
· Análisis de la significatividad global del modelo.
· Análisis de la significatividad individual de las variables.
· Cálculo del Coeficiente de Determinación.
· Dummy Variables.
Machine Learning
1. Definición.
2. Mapa conceptual.
3. Modelos supervisados:
1. Clasificación:
2. Regresión logística.
3. KNN.
4. Naive Bayes.
5. Árbol de clasificación.
6. C5.0
7. Random Forest.
8. XGBoost.
9.
2. Regresión:
1. Regresión.
2. Árbol de regresión.
3. Random Forest.
4. XGBoost.
d. Modelos no supervisados:
1. Clusterización
2. Reglas de asociación.
4. Series temporales univariantes.
Programación horaria
15, 17, 19, 22, 24 y 26 de noviembre de 9 a 14 horas
- de 9:00 - a 14:00
- -
- -