Fundamentos del Aprendizaje por Refuerzo

Reinforcement Learning (RL) es una técnica de aprendizaje automático en la que un programa informático (agente) aprende a comportarse en un entorno realizando las acciones y recibiendo retroalimentación sobre los resultados de las acciones. Por cada buena acción, el agente recibe una retroalimentación positiva, y por cada mala acción, el agente recibe una retroalimentación negativa (penalización).

Esta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a científicos de datos que desean ir más allá de los enfoques tradicionales de aprendizaje automático para enseñar a un programa informático a descifrar cosas (resolver problemas) sin el uso de datos etiquetados y grandes conjuntos de datos.

Al final de esta formación, los participantes serán capaces de:

Instale y aplique las bibliotecas y el lenguaje de programación necesarios para implementar Reinforcement Learning.
Cree un agente de software que sea capaz de aprender a través de la retroalimentación en lugar de a través del aprendizaje supervisado.
Programe un agente para resolver problemas en los que la toma de decisiones es secuencial y finita.
Aplicar el conocimiento para diseñar software que pueda aprender de una manera similar a cómo aprenden los humanos.

Formato del curso

Charla y discusión interactiva.
Muchos ejercicios y práctica.
Implementación práctica en un entorno de laboratorio en vivo.

Opciones de personalización del curso

Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertarlo.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Introducción

Aprendizaje a través del refuerzo positivo

Elements de Reinforcement Learning

Términos importantes (Acciones, Estados, Recompensas, Política, Valor, Valor Q, etcétera).

Descripción general de los métodos de soluciones tabulares

Creación de un agente software

Comprensión de los enfoques basados en valores, políticas y modelos

Trabajar con el Proceso de Decisión de Markov (MDP)

Cómo las políticas definen la forma de comportarse de un agente

Uso de métodos de Monte Carlo

Aprendizaje de Diferencias Temporales

Ping de paso n Bootstrap

Métodos de solución aproximada

Predicción en política con aproximación

Control en política con aproximación

Métodos fuera de la política con aproximación

Descripción de los seguimientos de elegibilidad

Uso de métodos de gradiente de políticas

Resumen y conclusión

Requerimientos

Experiencia con el aprendizaje automático
Programming experiencia

Audiencia

Científicos de datos

21 Horas

Formación Corporativa a Medida

Soluciones de formación diseñadas exclusivamente para empresas.

Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.

Inversión

Precio por grupo privado (formación online) desde 4800 € + IVA*

Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales

(*El precio final puede variar según la especialización técnica del curso, el nivel de personalización, la modalidad y el número de participantes)

¿Necesita ayuda para elegir el curso adecuado?

Fundamentos del Aprendizaje por Refuerzo

Temario del curso

Requerimientos

Formación Corporativa a Medida

Próximos cursos

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Fundamentos del Aprendizaje por Refuerzo

Temario del curso

Requerimientos

Formación Corporativa a Medida

Próximos cursos

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Fundamentos del Aprendizaje por Refuerzo

Cursos Relacionados

Aprendizaje de refuerzo profundo con Python

Ajuste fino con Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF)

Modelos de Lenguaje Grandes (LLMs) y Aprendizaje por Refuerzo (RL)

Aprendizaje por refuerzo con Google Colab

Categorías Relacionadas

Reinforcement Learning

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites