Programa del Curso

Introducción a Reinforcement Learning

  • ¿Qué es el aprendizaje por refuerzo?
  • Conceptos clave: agente, entorno, estados, acciones y recompensas
  • Desafíos en el aprendizaje por refuerzo

Exploración y Explotación

  • Equilibrar exploración y explotación en modelos de RL
  • Estrategias de exploración: epsilon-greedy, softmax y más

Q-Learning y Redes Neuronales Profundas (DQNs)

  • Introducción al Q-learning
  • Implementación de DQNs usando TensorFlow
  • Optimización del Q-learning con repetición de experiencias y redes objetivo

Métodos Basados en Políticas

  • Algoritmos de gradientes de políticas
  • Algoritmo REINFORCE y su implementación
  • Métodos actor-crítico

Trabajando con OpenAI Gym

  • Configuración de entornos en OpenAI Gym
  • Simulación de agentes en entornos dinámicos
  • Evaluación del desempeño de los agentes

Técnicas Avanzadas de Reinforcement Learning

  • Aprendizaje por refuerzo multiagente
  • Gradiente determinístico profundo (DDPG)
  • Optimización de políticas proximales (PPO)

Implementación de Modelos Reinforcement Learning

  • Aplicaciones del aprendizaje por refuerzo en el mundo real
  • Integración de modelos RL en entornos de producción

Resumen y Próximos Pasos

Requerimientos

  • Experiencia con Python programación
  • Comprensión básica de conceptos de aprendizaje profundo y machine learning
  • Conocimiento de algoritmos y conceptos matemáticos utilizados en el aprendizaje por refuerzo

Audiencia

  • Científicos de datos
  • Practicantes de machine learning
  • Investigadores de IA
 28 Horas

Próximos cursos

Categorías Relacionadas