Temario del curso

Introducción

  • Aprendizaje a través del refuerzo positivo

Elements de Reinforcement Learning

Términos importantes (Acciones, Estados, Recompensas, Política, Valor, Valor Q, etcétera).

Descripción general de los métodos de soluciones tabulares

Creación de un agente software

Comprensión de los enfoques basados en valores, políticas y modelos

Trabajar con el Proceso de Decisión de Markov (MDP)

Cómo las políticas definen la forma de comportarse de un agente

Uso de métodos de Monte Carlo

Aprendizaje de Diferencias Temporales

Ping de paso n Bootstrap

Métodos de solución aproximada

Predicción en política con aproximación

Control en política con aproximación

Métodos fuera de la política con aproximación

Descripción de los seguimientos de elegibilidad

Uso de métodos de gradiente de políticas

Resumen y conclusión

Requerimientos

  • Experiencia con el aprendizaje automático
  • Programming experiencia

Audiencia

  • Científicos de datos
 21 Horas

Formación Corporativa a Medida

Soluciones de formación diseñadas exclusivamente para empresas.

  • Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
  • Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
  • Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.
Inversión

Precio por grupo privado (formación online) desde 4800 € + IVA*

Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales

Próximos cursos

Categorías Relacionadas