Reinforcement learning y Deep Learning para el diseño de sistemas de toma de decisión

Mapas estratégicos y cuadros de mando: concreción y despliegue de estrategias y objetivos
2 mayo, 2022
Networking y conexiones en GARAIA Topagune Teknologikoa
6 mayo, 2022

Reinforcement learning y Deep Learning para el diseño de sistemas de toma de decisión

  • Lugar PTGaraia
  • Organizador Garaia Enpresa Digitala
  • Fecha 2, 4, 9, 11 y 16 mayo
  • Horario 09:00 - 13:00
  • Precio 70€

REINFORCEMENT LEARNIGN Y DEEP LEARNING PARA EL DISEÑO DE TOMA DE DECISIÓN

Fecha: Del 02/05/2022 al 16/05/2022
Hora: 09:00 – 13:00 (2, 4, 9, 11 y 16 mayo)
Lugar: Garaia Enpresa Digitala. Garaia Parke Teknologikoa, Goiru 1, 20500 Arrasate-Mondragon
Organizador: Garaia Enpresa Digitala
Precio: 70€

El aprendizaje por refuerzo (Reinforcement Learning) es un área del aprendizaje automático (Machine Learning) que se basa en la idea de aprender mediante “prueba y error”. El aprendizaje por refuerzo está mostrando buenos resultados en entornos complejos. El juego chino “Go” (con más de 10 elevado a 170 configuraciones del tablero de juego) o el control del vuelo de un helicóptero son dos ejemplos diferentes de referencia. Estas técnicas también se aplican a la conducción autónoma (coche/robot móvil), en sistemas de recomendación automatizados en marketing y e-commerce, en herramientas educativas personalizadas, en finanzas o en la manipulación robótica . Las redes neuronales profundas y los simuladores avanzados  han jugado un papel relevante para poder abordar dicha complejidad.

En este curso aprenderemos los conceptos básicos del aprendizaje por refuerzo utilizando el lenguaje de programación Python, Pytorch y simuladores disponibles sobre las plataformas abiertas de Google (Google Colab).

Dirigido a

Profesionales técnicos de cualquier sector de actividad con conocimientos de programación (preferiblemente Python) y estadística básica, interesados en implementar sistema para la toma de decisión basados en IA.

Programa

  • M0 – Introducción a la programación (Python y Pythorch)
  • M1 – Ejemplos reales 
  • M2 – Introducción al aprendizaje por refuerzo
  • M3 – Formalización de los fundamentos del aprendizaje por refuerzo
  • M4 – Aprendizaje por programación dinámica
  • M5 – Aprendizaje sin modelo del sistema
  • M6 – Diseño de controladores sin modelo del sistema a controlar
  • M7 – Uso de funciones de aproximación con redes neuronales (Deep Learning)
  • M8 – Controladores basados en la política
  • M9 – Controladores Actor Crítico
  • M10 – Estrategias de ajuste automático de los hiper parámetros de proceso de aprendizaje