Del martes 20 sep al 20 oct 2022 jueves

Análisis de datos con Python (Inicial- Intermedio)

Cursos
Online a través de plataforma virtual (en directo) 
20, 22, 27, 29 de septiembre y 4, 6, 11,13,18 y 20 de octubre de 2022
160 €

[+] CONSULTA LA OFERTA FORMATIVA DE CURSOS/MICROCURSOS

Curso Análisis de datos con Python (Inicial)

Fecha: 20, 22, 27, 29 de septiembre y 4, 6, 11,13,18 y 20 de octubre de 2022 

Horas: 20 horas

Horario: Desde las 17:00h a las 19:00h (exepto jueves 22 de septiembre que será 16:30h-18:30h)

Matrícula: 160 euros.

PRESENTACIÓN

Python es un lenguaje de programación de propósito general que, debido a sus ventajas, ha ganado una gran cuota de uso en el campo de la ciencia de datos. Este curso va dirigido hacia la generación de programas de análisis y visualización de datos que permitan aproximar a los alumnos a las bases del machine learning.


OBJETIVOS

  • Dominar el lenguaje de propósito general Python desde cero, incluyendo su instalación
  • Aprender los conceptos básicos de estadística necesarios para poder analizar los datos que nos rodean
  • Utilizar librerías tanto de uso general como dedicadas específicamente al análisis de datos, como Pandas
  • Representar gráficamente los datos para poder extraer conclusiones útiles de ellos y comprender la importancia de la modelización

 

DOCENTES

Raúl Marcos Alonso García, científico de datos.

 

PROGRAMA

  1. Principios básicos de programación aplicados a data science.
  2.  Entrada y salida de datos.
  3.  Conceptos básicos de estadística descriptiva. Introducción de la biblioteca Pandas.
  4.  Pretratamiento de datos: Formateo y filtrado.
  5.  Visualización de datos: presentación de la biblioteca Matplotlib.
  6.  Una primera aproximación a la modelización : Regresión lineal con Python.

 

DESARROLLO

Módulo 1.Principios básicos de programación aplicados a data science.

  • Nuestro objetivo. Diferencias entre información y conocimiento.
  • ¿Qué es la programación?
  • ¿Qué es Python?
  • Instalación de Python.
  • Instalación de Jupyter Notebook.
  • Variables y Tipos.
  • Operadores aritméticos.
  • Uso de strings.
  • Funciones.
  • Control de flujo, condicionales y bucles.

 Módulo 2. Entrada y salida de datos.

  • Entrada de datos de usuario.
  • Lectura y escritura de archivos.
  • Importación de datos desde diversas fuentes.
  • Web scraping.

 Módulo 3. Conceptos básicos de estadística descriptiva. Introducción de la biblioteca Pandas.

  • ¿Qué puede hacer Pandas por nosotros?
  • Análisis exploratorio de datos.
  • Estadística descriptiva e inferencia estadística.
  • Tendencia central y dispersión.

 Módulo 4. Pretratamiento de datos: Formateo y filtrado.

  • Vectorización de operaciones
  • Consultas
  • Filtrado
  • Ordenación
  • Agrupamiento
  • Imputación de valores

 

Módulo 5. Visualización de datos: presentación de la bibliotecas Matplotlib y Seaborn.

  • Gráficos básicos con Matplotlib.
  • Gráficos avanzados con Pandas y Seaborn.
  • Data stotytelling: Bokeh

 

Módulo 6. Una primera aproximación a la modelización : Regresión lineal con Python.

  • ¿Qué es un modelo?
  • Desarrollo del modelo
  • Predicción
  • Alcance y calidad del modelo

DESTINATARIOS

En este curso asumimos que no se tiene conocimientos previos de programación, pero que sí se tiene destreza en el manejo de ordenadores, y de forma muy recomendable, destreza con programas como hojas de cálculo, bases de datos, software de análisis estadístico, etc.

 

Mapa web del
Centro de Estudios Andaluces