Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Machine Learning Introducción
- Tipos de aprendizaje automático – supervisado vs no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- El flujo de trabajo del data mining: comprensión del negocio, preparación de datos, modelado, implementación
- Elegir el algoritmo adecuado para la tarea
- Sobreajuste y el compromiso sesgo-varianza
Python y Resumen de Bibliotecas ML
- Por qué usar lenguajes de programación para ML
- Elegir entre R y Python
- Tutorial rápido de Python y Jupyter Notebooks
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Prueba y Evaluación de Algoritmos ML
- Generalización, sobreajuste y validación del modelo
- Estrategias de evaluación: holdout, cross-validation, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
- Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva lift
- Selección y búsqueda en cuadrícula del modelo para ajuste
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Gestión de valores faltantes y outliers
- Estandarización, normalización y transformación
- Codificación de datos cualitativos y manipulación de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs multiclase
- Regresión logística y funciones discriminantes
- Naïve Bayes, k-vecinos más cercanos
- Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
- Máquinas de vectores soporte y núcleos
- Técnicas de aprendizaje en conjunto
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Unsupervised Learning
- Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs
- Reducción de dimensionalidad: PCA, análisis factorial, SVD
- Escala multidimensional
Mining de Texto
- Preprocesamiento y tokenización del texto
- Bolsa de palabras, stemming y lematización
- Análisis de sentimiento y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras
Sistemas de Recomendación
- Filtrado colaborativo basado en usuarios e ítems
- Diseño y evaluación de motores de recomendaciones
Minería de Patrones Asociativos
- Conjuntos frecuentes y algoritmo Apriori
- Análisis de cesta de compras y razón lift
Detección de Outliers
- Análisis de valores extremos
- Métodos basados en distancia y densidad
- Detección de outliers en datos de alta dimensionalidad
Machine Learning Estudio de Caso
- Comprender el problema del negocio
- Preprocesamiento de datos y ingeniería de características
- Selección y ajuste de parámetros del modelo
- Evaluación y presentación de hallazgos
- Implementación
Resumen y Próximos Pasos
Requerimientos
- Comprensión básica de estadísticas y álgebra lineal
- Familiaridad con conceptos de análisis de datos o inteligencia empresarial
- Alguna exposición a la programación (preferiblemente en Python o R) es recomendada
- Interés en aprender machine learning aplicado para proyectos basados en datos
Publido objetivo
- Analistas y científicos de datos
- Estadísticos y profesionales de investigación
- Desarrolladores y profesionales IT explorando herramientas de machine learning
- Cualquiera involucrado en proyectos de ciencia de datos o análisis predictivo
21 Horas