Temario del curso

Fundamentos de la Depuración y Evaluación de Mastra

  • Comprender modelos de comportamiento del agente y modos de fallo
  • Principios fundamentales de depuración dentro de Mastra
  • Evaluar acciones deterministas y no deterministas del agente

Configurando Entornos para la Prueba de Agentes

  • Configurar cajas de arena de pruebas y espacios de evaluación aislados
  • Capturar logs, rastros y telemetría para un análisis detallado
  • Preparar conjuntos de datos y prompts para pruebas estructuradas

Depuración del Comportamiento del Agente AI

  • Rastrear caminos de decisión y señales de razonamiento interno
  • Identificar alucinaciones, errores y comportamientos no deseados
  • Usar paneles de observabilidad para investigar la causa raíz

Métricas de Evaluación y Marco de Benchmarking

  • Definir métricas cuantitativas y cualitativas de evaluación
  • Medir precisión, consistencia y cumplimiento contextual
  • Aplicar conjuntos de datos de benchmark para una evaluación repetible

Ingeniería de Fiabilidad para Agentes AI

  • Diseñar pruebas de fiabilidad para agentes en ejecución prolongada
  • Detectar desvío y degradación en el rendimiento del agente
  • Implementar salvaguardas para flujos de trabajo críticos

Procesos de Garantía de Calidad y Automatización

  • Construir canales de QA para evaluación continua
  • Automatizar pruebas de regresión para actualizaciones de agentes
  • Integrar QA con CI/CD y flujos de trabajo empresariales

Técnicas Avanzadas para Reducir Alucinaciones

  • Estrategias de prompts para reducir salidas no deseadas
  • Bucles de validación y mecanismos de autochequeo
  • Experimentar con combinaciones de modelos para mejorar la fiabilidad

Informes, Monitoreo y Mejora Continua

  • Desarrollar informes de QA y tarjetas de puntuación del agente
  • Monitorear el comportamiento a largo plazo y patrones de errores
  • Iterar en marcos de evaluación para sistemas en evolución

Resumen y Próximos Pasos

Requerimientos

  • Comprensión del comportamiento de los agentes AI y las interacciones del modelo
  • Experiencia en la depuración o pruebas de sistemas de software complejos
  • Familiaridad con herramientas de observabilidad o registro de logs

Audiencia

  • Ingenieros de QA
  • Ingenieros de fiabilidad AI
  • Desarrolladores responsables de la calidad y el rendimiento del agente
 21 Horas

Próximos cursos

Categorías Relacionadas