Programa del Curso
Introducción al Aprendizaje Automático
- Tipos de aprendizaje automático: supervisado vs. no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelado, implementación
- Elegir el algoritmo correcto para la tarea
- Sobreajuste y el compromiso entre sesgo y varianza
Introducción a Python y sus Bibliotecas de Aprendizaje Automático
- Por qué usar lenguajes de programación para ML
- Elegir entre R y Python
- Curso intensivo de Python y cuadernos Jupyter
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pruebas y Evaluación de Algoritmos de Aprendizaje Automático
- Generalización, sobreajuste y validación del modelo
- Estrategias de evaluación: holdout, cross-validation, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
- Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva de elevación
- Selección de modelos y búsqueda en cuadrícula para ajuste
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Gestión de valores faltantes y valores atípicos
- Estandarización, normalización y transformación
- Codificación de datos cualitativos y limpieza de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs. multiclase
- Regresión logística y funciones discriminantes
- Naïve Bayes, k-vecinos más cercanos
- Árboles de decisión: CART, Bosques Aleatorios, Bagging, Boosting, XGBoost
- Máquinas de soporte vectorial y núcleos
- Técnicas de aprendizaje en conjunto
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Aprendizaje No Supervisado
- Técnicas de clustering: k-means, k-medoids, clustering jerárquico, SOMs
- Reducción de dimensionalidad: PCA, análisis factorial, SVD
- Escalado multidimensional
Minería de Texto
- Preprocesamiento y tokenización de texto
- Bolsa de palabras, stemming y lematización
- Análisis de sentimientos y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras
Sistemas de Recomendación
- Filtrado colaborativo basado en usuarios y en elementos
- Diseño y evaluación de motores de recomendación
Minería de Patrones de Asociación
- Conjuntos de ítems frecuentes y algoritmo Apriori
- Análisis de cestas de compra y razón de elevación
Detección de Valores Atípicos
- Análisis de valores extremos
- Métodos basados en distancia y densidad
- Detección de valores atípicos en datos de alta dimensionalidad
Estudio de Caso de Aprendizaje Automático
- Comprensión del problema de negocio
- Preprocesamiento de datos y ingeniería de características
- Selección de modelos y ajuste de parámetros
- Evaluación y presentación de resultados
- Implementación
Resumen y Pasos Siguientes
Requerimientos
- Comprensión básica de estadísticas y álgebra lineal
- Familiaridad con conceptos de análisis de datos o inteligencia empresarial
- Alguna exposición a la programación (preferiblemente Python o R) es recomendada
- Interés en aprender aprendizaje automático aplicado para proyectos basados en datos
Público Objetivo
- Analistas y científicos de datos
- Estadísticos y profesionales de investigación
- Desarrolladores y profesionales de TI que exploran herramientas de aprendizaje automático
- Cualquiera involucrado en proyectos de ciencia de datos o análisis predictivo
Testimonios (3)
A pesar de tener que faltar un día debido a reuniones con clientes, siento que tengo una comprensión mucho más clara de los procesos y técnicas utilizados en Machine Learning y cuándo usaría una aproximación sobre otra. Nuestro desafío ahora es practicar lo que hemos aprendido y comenzar a aplicarlo a nuestro dominio de problemas.
Richard Blewett - Rock Solid Knowledge Ltd
Curso - Machine Learning – Data science
Traducción Automática
Me gusta que la formación se centrara en ejemplos y codificación. Pensaba que era imposible condensar tanta información en tres días de entrenamiento, pero me equivoqué. La formación abarcó muchos temas y todo se hizo de una manera muy detallada (especialmente el ajuste de los parámetros del modelo - no esperaba que hubiera tiempo para esto y quedé gratamente sorprendido).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática
Mostrando muchos métodos con guiones previamente preparados - materiales muy bien preparados y fáciles de rastrear
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática