Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la Depuración y Evaluación de Mastra
- Comprender modelos de comportamiento del agente y modos de fallo
- Principios fundamentales de depuración dentro de Mastra
- Evaluar acciones deterministas y no deterministas del agente
Configurando Entornos para la Prueba de Agentes
- Configurar cajas de arena de pruebas y espacios de evaluación aislados
- Capturar logs, rastros y telemetría para un análisis detallado
- Preparar conjuntos de datos y prompts para pruebas estructuradas
Depuración del Comportamiento del Agente AI
- Rastrear caminos de decisión y señales de razonamiento interno
- Identificar alucinaciones, errores y comportamientos no deseados
- Usar paneles de observabilidad para investigar la causa raíz
Métricas de Evaluación y Marco de Benchmarking
- Definir métricas cuantitativas y cualitativas de evaluación
- Medir precisión, consistencia y cumplimiento contextual
- Aplicar conjuntos de datos de benchmark para una evaluación repetible
Ingeniería de Fiabilidad para Agentes AI
- Diseñar pruebas de fiabilidad para agentes en ejecución prolongada
- Detectar desvío y degradación en el rendimiento del agente
- Implementar salvaguardas para flujos de trabajo críticos
Procesos de Garantía de Calidad y Automatización
- Construir canales de QA para evaluación continua
- Automatizar pruebas de regresión para actualizaciones de agentes
- Integrar QA con CI/CD y flujos de trabajo empresariales
Técnicas Avanzadas para Reducir Alucinaciones
- Estrategias de prompts para reducir salidas no deseadas
- Bucles de validación y mecanismos de autochequeo
- Experimentar con combinaciones de modelos para mejorar la fiabilidad
Informes, Monitoreo y Mejora Continua
- Desarrollar informes de QA y tarjetas de puntuación del agente
- Monitorear el comportamiento a largo plazo y patrones de errores
- Iterar en marcos de evaluación para sistemas en evolución
Resumen y Próximos Pasos
Requerimientos
- Comprensión del comportamiento de los agentes AI y las interacciones del modelo
- Experiencia en la depuración o pruebas de sistemas de software complejos
- Familiaridad con herramientas de observabilidad o registro de logs
Audiencia
- Ingenieros de QA
- Ingenieros de fiabilidad AI
- Desarrolladores responsables de la calidad y el rendimiento del agente
21 Horas