Python
PRECIO: 450 €
PRECIO SOCIOS CLUSTER TECNOLOGICO GAIA: 360 €
OBJETIVO DEL CURSO
- Dominar los fundamentos de programación de Python.
- Ver el funcionamiento de algunas librerías de niveles básico y avanzado.
- Conocer diferentes entornos dentro de Python (Spyder y Jupyter Notebook).
- Conocer diferentes procedimientos propios del análisis de datos.
DURACIÓN
15 horas.
PROGRAMA
Introducción a Python:
- Introducción y operaciones comunes con números, cadenas, listas, tuplas y diccionarios.
- Mutación, alias y clonación de listas.
- Control de flujo – condicionales.
- Iteraciones.
- Funciones.
- Recursividad.
- Módulos y archivos.
Preprocesamiento de datos (ETL):
- Modificación básica de variables:
- Carga de bases de datos.
- Manipulación de datos.
- Creación de nuevas columnas/variables.
- Manipulación de columnas/variables.
- Cálculo de estadísticos básicos.
- Consultas cruzadas.
- Unión de varias tablas.
- Operaciones con variables.
- Muestra de datos.
- Ejercicios prácticos.
Análisis Preliminar:
- Conocimiento básico de los datos.
- Análisis de las variables.
- Determinación de las diferentes clases de datos existentes.
- Gráficos básicos de las variables individuales.
- Gráficos básicos sobre las relaciones de las variables.
- Gráficos avanzados sobre las relaciones entre las variables.
- Gráficos avanzados sobre la correlación entre variables.
- Interpretación de los gráficos.
Corrección de errores tipográficos.
- Unión de tablas:
- Concatenación de tablas.
- Unión de tablas en función de una o varias variables:
- Left join
- Right join.
- Inner join.
- Outer join.
- Modificaciones avanzadas:
- Selección de elementos únicos.
- Transformación de caracteres de forma individualizada.
- Transformación de caracteres de forma masiva.
- Transformación del formato de las variables.
- Transformación de tablas:
- Agregaciones simples.
- Agregaciones compuestas.
- Verticalización de tablas.
- Normalización de tablas.
- Filtrados:
- Eliminación de duplicados.
- Filtrado por valores.
- Filtrado por otra tabla.
- Filtrado por las observaciones de otra tabla.
- Selección de elementos diferentes.
- Filtrado por los valores de una variable de otra tabla.
- Tratamiento de valores perdidos:
- Definición y problemas de su no tratamiento.
- Eliminación de las observaciones.
- Imputación de estadísticos básicos: media, mediana y moda.
- Métodos de imputación múltiple (MICE).
- Outliers:
- Definición.
- Problemas de su no tratamiento.
- Eliminación de las observaciones
- Determinación de los outliers.
- Transformación de los outliers.
- Creación de nuevas variables dummy.
Programación horaria
De lunes a Viernes
- de 10:00 - a 13:00
¡Agotado!