Temario del curso
Módulo 1: Python Core para Flujos de Trabajo de ML
• Inicio del curso y configuración del entorno
Alinear objetivos y configurar un espacio de trabajo de ML de Python reproducible
• Esenciales del lenguaje Python (rápido)
Repaso de sintaxis, flujo de control, funciones y patrones comúnmente utilizados en códigos de ML
• Estructuras de datos para ML
Listas, diccionarios, conjuntos y tuplas para características, etiquetas y metadatos
• Comprensiones y herramientas funcionales
Expresar transformaciones usando comprensiones y funciones de orden superior
• Python orientado a objetos para desarrolladores de ML
Clases, métodos, composición y decisiones de diseño prácticas
• dataclasses y modelado ligero
Contenedores tipados para configuración, ejemplos y resultados
• Decoradores y administradores de contexto
Tiempo, caché, registro y patrones de ejecución segura de recursos
• Trabajo con archivos y rutas
Manejo robusto de conjuntos de datos y formatos de serialización
• Excepciones y programación defensiva
Escribir scripts de ML que fallen de manera segura y transparente
• Módulos, paquetes y estructura del proyecto
Organizar códigos de ML reutilizables
• Tipado y calidad del código
Pistas de tipo, documentación y estructura amigable con el lint
Módulo 2: Python Numérico, SciPy y Manejo de Datos
• Fundamentos de NumPy para computación vectorizada
Operaciones de array eficientes y codificación consciente del rendimiento
• Indexación, segmentación, transmisión y formas
Manipulación de tensores segura y razonamiento de formas
• Esenciales de álgebra lineal con NumPy y SciPy
Operaciones de matriz estables y descomposiciones utilizadas en ML
• Profundización en SciPy
Estadísticas, optimización, ajuste de curvas y matrices dispersas
• Pandas para datos tabulares de ML
Limpieza, unión, agregación y preparación de conjuntos de datos
• Profundización en scikit-learn
Interfaz de estimador, pipelines y flujos de trabajo reproducibles
• Esenciales de visualización
Gráficos diagnósticos para la exploración de datos y el comportamiento del modelo
Módulo 3: Patrones de Programación para Construir Aplicaciones de ML
• De cuaderno a proyecto mantenible
Refactorización de código exploratorio en paquetes estructurados
• Gestión de configuración
Parámetros externos y validación de inicio
• Registro, advertencias y observabilidad
Registro estructurado para sistemas de ML depurables
• Componentes reutilizables con OOP y composición
Diseño de transformadores y predictores extensibles
• Patrones de diseño prácticos
Patrones Pipeline, Factory o Registry, Strategy y Adapter
• Validación de datos y verificación de esquemas
Prevención de problemas de datos silenciosos
• Rendimiento y perfilado
Identificación de cuellos de botella y aplicación de técnicas de optimización
• Entrada y salida de modelos y interfaces de inferencia
Persistencia segura e interfaces de predicción limpias
• Mini construcción de extremo a extremo
Pipeline de ML estilo producción con configuración y registro
Módulo 4: Aprendizaje Estadístico para Datos Tabulares, Texto e Imágenes
• Fundamentos de evaluación
Divisiones de entrenamiento y validación, validación cruzada honesta y métricas alineadas con el negocio
• Aprendizaje de máquina avanzado para datos tabulares
GLMs regularizados, ensambles de árboles y preprocesamiento sin fugas
• Calibración y incertidumbre
Escalado de Platt, regresión isotónica, bootstrap y predicción conforme
• Métodos NLP clásicos
Compromisos de tokenización, TF-IDF, modelos lineales y Naive Bayes
• Modelado de temas
Fundamentos de LDA y limitaciones prácticas
• Visión por computadora clásica
HOG, PCA y pipelines basados en características
• Análisis de errores
Detección de sesgo, ruido de etiquetas y correlaciones espurias
• Laboratorios prácticos
Pipeline de datos tabulares sin fugas
Comparación y interpretación de baselines de texto
Baseline de visión clásica con análisis de fallas estructurado
Módulo 5: Redes Neuronales para Datos Tabulares, Texto e Imágenes
• Dominio del bucle de entrenamiento
Bucles de PyTorch limpios con AMP, recorte y reproducibilidad
• Optimización y regularización
Inicialización, normalización, optimizadores y programadores
• Precisión mixta y escalado
Acumulación de gradientes y estrategias de checkpointing
• Redes neuronales tabulares
Embeddings categóricos, cruces de características y estudios de ablación
• Redes neuronales de texto
Embeddings, CNNs, BiLSTM o GRU y manejo de secuencias
• Redes neuronales de visión
Fundamentos de CNN y arquitecturas tipo ResNet
• Laboratorios prácticos
Marco de entrenamiento reutilizable
Comparación de NN tabulares vs boosting
CNN con experimentos de aumento y programación
Módulo 6: Arquitecturas Neuronales Avanzadas
• Estrategias de transferencia de aprendizaje
Patrones de congelar y descongelar, tasas de aprendizaje discriminatorias
• Arquitecturas de transformers para texto
Internos de atención propia y enfoques de fine-tuning
• Backbones de visión y predicción densa
ResNet, EfficientNet, Transformers de Visión y conceptos de U-Net
• Arquitecturas tabulares avanzadas
TabTransformer, FT-Transformer y redes Profundas y Cruzadas
• Consideraciones de series temporales
Divisiones temporales y detección de desplazamiento de covariables
• Técnicas de PEFT y eficiencia
LoRA, distilación y compromisos de cuantización
• Laboratorios prácticos
Fine-tuning de un transformer de texto preentrenado
Fine-tuning de un modelo de visión preentrenado
Comparación de Tabular Transformer vs GBDT
Módulo 7: Sistemas de IA Generativa
• Fundamentos de prompting
Prompting estructurado y generación controlada
• Fundamentos de LLM
Tokenización, ajuste de instrucciones y mitigación de alucinaciones
• Generación Aumentada por Recuperación
Chunking, embeddings, búsqueda híbrida y métricas de evaluación
• Estrategias de fine-tuning
LoRA y QLoRA con controles de calidad de datos
• Modelos de difusión
Intuición de difusión latente y adaptación práctica
• Datos tabulares sintéticos
CTGAN y consideraciones de privacidad
• Laboratorios prácticos
Mini-aplicación de RAG estilo producción
Validación de salida estructurada con aplicación de esquemas
Experimentación de difusión opcional
Módulo 8: Agentes de IA y MCP
• Diseño del bucle del agente
Observar, planificar, actuar, reflexionar y persistir
• Arquitecturas de agentes
ReAct, plan-and-execute y coordinación de múltiples agentes
• Gestión de memoria
Enfoques episódicos, semánticos y de pizarra
• Integración de herramientas y seguridad
Contratos de herramientas, sandboxing y defensas contra inyección de prompts
• Marcos de evaluación
Trazas reproducibles, suites de tareas y pruebas de regresión
• MCP y interoperabilidad basada en protocolos
Diseño de servidores MCP con exposición segura de herramientas
• Laboratorios prácticos
Construir un agente desde cero
Exponer herramientas a través de un servidor estilo MCP
Crear un arnés de evaluación con restricciones de seguridad
Requerimientos
Los participantes deben tener conocimientos funcionales de programación en Python.
Este programa está destinado a profesionales técnicos de nivel intermedio a avanzado.
Formación Corporativa a Medida
Soluciones de formación diseñadas exclusivamente para empresas.
- Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
- Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
- Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.
Precio por grupo privado (formación online) desde 8000 € + IVA*
Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales
Testimonios (2)
el ecosistema de ML no solo incluye MLFlow sino también Optuna, hyperops, Docker y docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curso - MLflow
Traducción Automática
Disfruté participando en el entrenamiento de Kubeflow, que se llevó a cabo de manera remota. Este entrenamiento me permitió consolidar mi conocimiento sobre los servicios de AWS, K8s y todas las herramientas de DevOps relacionadas con Kubeflow, que son las bases necesarias para abordar el tema adecuadamente. Quiero agradecer a Malawski Marcin por su paciencia y profesionalismo en la formación y los consejos sobre mejores prácticas. Malawski aborda el tema desde diferentes ángulos, utilizando diferentes herramientas de despliegue como Ansible, EKS kubectl y Terraform. Ahora estoy definitivamente convencido de que me dirijo hacia el campo de aplicación correcto.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curso - Kubeflow
Traducción Automática