Temario del curso

Panorama de las tecnologías de reconocimiento de voz

  • Historia y evolución del reconocimiento de voz
  • Modelos acústicos, modelos de lenguaje y decodificación
  • Arquitecturas modernas: RNNs, transformers y Whisper

Preprocesamiento de audio y fundamentos de transcripción

  • Manejo de formatos de audio y tasas de muestreo
  • Limpieza, recorte y segmentación de audio
  • Generación de texto a partir del audio: en tiempo real vs por lotes

Práctica con Whisper y otras APIs

  • Instalación y uso de OpenAI Whisper
  • Llamadas a APIs en la nube (Google, Azure) para transcripción
  • Comparación de rendimiento, latencia y costo

Idiomas, acentos y adaptación al dominio

  • Trabajo con múltiples idiomas y acentos
  • Vocabularios personalizados y tolerancia al ruido
  • Manejo de lenguaje legal, médico o técnico

Formateo de salida e integración

  • Adición de marcas de tiempo, puntuación y etiquetas de orador
  • Exportación a formatos de texto, SRT o JSON
  • Integración de transcripciones en aplicaciones o bases de datos

Laboratorios de implementación de casos de uso

  • Transcripción de reuniones, entrevistas o podcasts
  • Sistemas de comandos voz a texto
  • Subtítulos en tiempo real para transmisiones de video/audio

Evaluación, limitaciones y ética

  • Métricas de precisión y benchmarking de modelos
  • Sesgo y equidad en los modelos de voz
  • Consideraciones de privacidad y cumplimiento normativo

Resumen y próximos pasos

Requerimientos

  • Un conocimiento de conceptos generales de IA y aprendizaje automático
  • Familiaridad con formatos y herramientas de archivos de audio o multimedia

Público objetivo

  • Científicos de datos e ingenieros de IA que trabajan con datos de voz
  • Desarrolladores de software que construyen aplicaciones basadas en transcripción
  • Organizaciones que exploran el reconocimiento de voz para la automatización
 14 Horas

Formación Corporativa a Medida

Soluciones de formación diseñadas exclusivamente para empresas.

  • Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
  • Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
  • Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.
Inversión

Precio por grupo privado (formación online) desde 3200 € + IVA*

Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales

Próximos cursos

Categorías Relacionadas