Programa del Curso

Machine Learning Introducción

  • Tipos de aprendizaje automático – supervisado vs no supervisado
  • Del aprendizaje estadístico al aprendizaje automático
  • El flujo de trabajo del data mining: comprensión del negocio, preparación de datos, modelado, implementación
  • Elegir el algoritmo adecuado para la tarea
  • Sobredispersión y el compromiso sesgo-varianza

Python y Resumen de Bibliotecas ML

  • Por qué usar lenguajes de programación para ML
  • Elegir entre R y Python
  • Tutorial rápido de Python y Jupyter Notebooks
  • Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Pruebas y Evaluación de Algoritmos ML

  • Generalización, sobredispersión y validación del modelo
  • Estrategias de evaluación: holdout, validación cruzada, bootstrapping
  • Métricas para regresión: ME, MSE, RMSE, MAPE
  • Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
  • Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva de elevación
  • Selección y búsqueda en cuadrícula del modelo para ajuste

Preparación de Datos

  • Importación y almacenamiento de datos en Python
  • Análisis exploratorio y estadísticas descriptivas
  • Gestión de valores faltantes y outliers
  • Estandarización, normalización y transformación
  • Codificación de datos cualitativos y manipulación de datos con pandas

Algoritmos de Clasificación

  • Clasificación binaria vs multiclase
  • Regresión logística y funciones discriminantes
  • Naïve Bayes, k-vecinos más cercanos
  • Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máquinas de vectores soporte y núcleos
  • Técnicas de aprendizaje en ensambles

Regresión y Predicción Numérica

  • Mínimos cuadrados y selección de variables
  • Métodos de regularización: L1, L2
  • Regresión polinomial y modelos no lineales
  • Árboles de regresión y splines

Neural Networks

  • Introducción a las redes neuronales y el aprendizaje profundo
  • Funciones de activación, capas y retropropagación
  • Multilayer perceptrons (MLP)
  • Uso de TensorFlow o PyTorch para modelado básico de redes neuronales
  • Redes neuronales para clasificación y regresión

Ventas Forecasting y Predictive Analytics

  • Pronóstico basado en series temporales vs regresión
  • Gestión de datos estacionales y basados en tendencias
  • Construcción de un modelo de pronóstico de ventas utilizando técnicas ML
  • Evaluación de la precisión del pronóstico e incertidumbre
  • Business interpretación y comunicación de resultados

Unsupervised Learning

  • Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs
  • Reducción de dimensionalidad: PCA, análisis factorial, SVD
  • Escala multidimensional

Mining de Texto

  • Preprocesamiento y tokenización del texto
  • Bolsa de palabras, stemming y lematización
  • Análisis de sentimientos y frecuencia de palabras
  • Visualización de datos de texto con nubes de palabras

Sistemas de Recomendación

  • Filtrado colaborativo basado en usuarios e ítems
  • Diseño y evaluación de motores de recomendaciones

Minería de Patrones Asociativos

  • Juegos frecuentes de elementos y algoritmo Apriori
  • Análisis del cesto de compras y razón de elevación

Detección de Outliers

  • Análisis de valores extremos
  • Métodos basados en distancia y densidad
  • Detección de outliers en datos de alta dimensionalidad

Machine Learning Estudio de Caso

  • Comprender el problema del negocio
  • Preprocesamiento de datos e ingeniería de características
  • Selección y ajuste de parámetros del modelo
  • Evaluación y presentación de hallazgos
  • Implementación

Resumen y Próximos Pasos

Requerimientos

  • Conocimiento básico de conceptos de aprendizaje automático, como el aprendizaje supervisado y no supervisado
  • Familiaridad con Python programación (variables, bucles, funciones)
  • Alguna experiencia en manejo de datos utilizando bibliotecas como pandas o NumPy es útil pero no obligatoria
  • No se espera experiencia previa con modelado avanzado o redes neuronales

Público objetivo

  • Científicos de datos
  • Business analistas
  • Ingenieros de software y profesionales técnicos que trabajan con datos
 28 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas