MACHINE LEARNING (Subvencionado)
DURACIÓN
30 horas.
Fechas:
27, 29 de noviembre y 4, 11, 13 y 18 de diciembre
Horario:
9:00-14:00
Temario:
Outliers:
· Definición.
· Problemas de su no tratamiento.
· Detección de outliers:
o Gráficamente.
o Extracción de los outliers.
o Determinación de las observaciones que incluyen outliers.
o Extracción de los valores de los outliers.
· Tratamiento de los outliers:
o Eliminación de las observaciones.
o Transformación en NAs.
o Creación de nuevas variables dummy de forma masiva.
o Tratamiento individualizado.
Valores perdidos:
· Cuantificación de los valores perdidos:
o Total.
o Por variables.
o Por observaciones.
· Análisis gráfico de los valores perdidos.
· Eliminación de los valores perdidos variable por variables.
· Eliminación masiva de los valores perdidos.
· Eliminación de variables con alto porcentaje de valores perdidos.
· Imputación por valores estadísticos (media, moda, mediana)
· Métodos de imputación múltiple.
· Creación de modelos para la imputación.
Estadísticos básicos: Cálculo e interpretación de la:
· Media.
· Mediana.
· Moda
· Varianza.
· Covarianza.
· Correlación.
Regresión como base de la modelización:
· Regresión lineal simple.
· Regresión lineal general.
· Regresión polinómica.
· Regresión logística.
· Error Cuadrático Medio y Error Absoluto.
· Estimación de la recta de regresión.
· Análisis de la significatividad global del modelo.
· Análisis de la significatividad individual de las variables.
· Cálculo del Coeficiente de Determinación.
· Dummy Variables.
Machine Learning
1. Definición.
2. Mapa conceptual.
3. Modelos supervisados:
1. Clasificación:
2. Regresión logística.
3. KNN.
4. Naive Bayes.
5. Árbol de clasificación.
6. C5.0
7. Random Forest.
8. XGBoost.
2. Regresión:
1. Regresión.
2. Árbol de regresión.
3. Random Forest.
4. XGBoost.
d. Modelos no supervisados:
-Clusterización
-Reglas de asociación.
4. Series temporales univariantes