Programa del Curso

Introducción al Aprendizaje Automático

  • Tipos de aprendizaje automático: supervisado vs. no supervisado
  • Del aprendizaje estadístico al aprendizaje automático
  • El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelado, implementación
  • Elegir el algoritmo correcto para la tarea
  • Sobreajuste y el compromiso entre sesgo y varianza

Introducción a Python y sus Bibliotecas de Aprendizaje Automático

  • Por qué usar lenguajes de programación para ML
  • Elegir entre R y Python
  • Curso intensivo de Python y cuadernos Jupyter
  • Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Pruebas y Evaluación de Algoritmos de Aprendizaje Automático

  • Generalización, sobreajuste y validación del modelo
  • Estrategias de evaluación: holdout, cross-validation, bootstrapping
  • Métricas para regresión: ME, MSE, RMSE, MAPE
  • Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
  • Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva de elevación
  • Selección de modelos y búsqueda en cuadrícula para ajuste

Preparación de Datos

  • Importación y almacenamiento de datos en Python
  • Análisis exploratorio y estadísticas descriptivas
  • Gestión de valores faltantes y valores atípicos
  • Estandarización, normalización y transformación
  • Codificación de datos cualitativos y limpieza de datos con pandas

Algoritmos de Clasificación

  • Clasificación binaria vs. multiclase
  • Regresión logística y funciones discriminantes
  • Naïve Bayes, k-vecinos más cercanos
  • Árboles de decisión: CART, Bosques Aleatorios, Bagging, Boosting, XGBoost
  • Máquinas de soporte vectorial y núcleos
  • Técnicas de aprendizaje en conjunto

Regresión y Predicción Numérica

  • Mínimos cuadrados y selección de variables
  • Métodos de regularización: L1, L2
  • Regresión polinomial y modelos no lineales
  • Árboles de regresión y splines

Aprendizaje No Supervisado

  • Técnicas de clustering: k-means, k-medoids, clustering jerárquico, SOMs
  • Reducción de dimensionalidad: PCA, análisis factorial, SVD
  • Escalado multidimensional

Minería de Texto

  • Preprocesamiento y tokenización de texto
  • Bolsa de palabras, stemming y lematización
  • Análisis de sentimientos y frecuencia de palabras
  • Visualización de datos de texto con nubes de palabras

Sistemas de Recomendación

  • Filtrado colaborativo basado en usuarios y en elementos
  • Diseño y evaluación de motores de recomendación

Minería de Patrones de Asociación

  • Conjuntos de ítems frecuentes y algoritmo Apriori
  • Análisis de cestas de compra y razón de elevación

Detección de Valores Atípicos

  • Análisis de valores extremos
  • Métodos basados en distancia y densidad
  • Detección de valores atípicos en datos de alta dimensionalidad

Estudio de Caso de Aprendizaje Automático

  • Comprensión del problema de negocio
  • Preprocesamiento de datos y ingeniería de características
  • Selección de modelos y ajuste de parámetros
  • Evaluación y presentación de resultados
  • Implementación

Resumen y Pasos Siguientes

Requerimientos

  • Comprensión básica de estadísticas y álgebra lineal
  • Familiaridad con conceptos de análisis de datos o inteligencia empresarial
  • Alguna exposición a la programación (preferiblemente Python o R) es recomendada
  • Interés en aprender aprendizaje automático aplicado para proyectos basados en datos

Público Objetivo

  • Analistas y científicos de datos
  • Estadísticos y profesionales de investigación
  • Desarrolladores y profesionales de TI que exploran herramientas de aprendizaje automático
  • Cualquiera involucrado en proyectos de ciencia de datos o análisis predictivo
 21 Horas

Testimonios (3)

Próximos cursos

Categorías Relacionadas