Programa del Curso

Esquema de entrenamiento detallado

1. Introducción a NLP

  • Comprender PNL
  • Marcos NLP
  • Aplicaciones comerciales de NLP
  • Recortando datos de la web
  • Trabajando con varias API para recuperar datos de texto
  • Trabajo y almacenamiento de contenido de texto de las corporaciones que guarda contenido y metadatos relevantes
  • Ventajas de usar el curso intensivo de Python y NLTK

2. Comprensión práctica de un corpus y conjunto de datos

  • ¿Por qué necesitamos un corpus?
  • Análisis de Corpus
  • Tipos de atributos de datos
  • Diferentes formatos de archivo para corpora
  • Preparación de un conjunto de datos para aplicaciones NLP

3, Comprender la estructura de una oración

  • Componentes de NLP
  • Comprensión del lenguaje natural
  • Análisis morfológico - stem, word, token, etiquetas de voz
  • Análisis sintáctico
  • Análisis semántico
  • Manejando ambigiuty

4. Preprocesamiento de datos de texto

  • Corpus- texto sin formato
    • Tokenización de oraciones
    • Stemming para texto sin formato
    • Lemización del texto sin formato
    • Detener la eliminación de palabras
  • Oraciones de corpus-raw
    • Word tokenization
    • Palabra lematización
  • Trabajar con matrices Término-Documento / Documento-Término
  • Tokenización de texto en n-grams y oraciones
  • Preprocesamiento práctico y personalizado

5. Analizando datos de texto

  • Característica básica de NLP
    • Analizadores y análisis
    • Etiquetado POS y taggers
    • Nombre reconocimiento de entidad
    • N-grams
    • Bolsa de palabras
  • Características estadísticas de PNL
    • Conceptos de álgebra lineal para PNL
    • Teoría probabilística para PNL
    • TF-IDF
    • Vectorización
    • Encoders and Decoders
    • Normalización
    • Modelos probabilísticos
  • Ingeniería de características avanzadas y PNL
    • Conceptos básicos de word2vec
    • Componentes del modelo word2vec
    • Lógica del modelo word2vec
    • Extensión del concepto de word2vec
    • Aplicación del modelo word2vec
  • Estudio de caso: aplicación de una bolsa de palabras: resumen automático de texto usando algoritmos de Luhn simplificados y verdaderos

6. Agrupación de documentos, clasificación y modelado de temas

  • Agrupación de documentos y minería de patrones (agrupación jerárquica, k-medias, agrupamiento, etc.)
  • Comparación y clasificación de documentos utilizando medidas de distancia de TFIDF, Jaccard y coseno
  • Clasificación de documentos usando Naïve Bayes y Maximum Entropy

7. Identificar elementos de texto importantes

  • Reducción de la dimensionalidad: análisis de componentes principales, factorización de la descomposición no negativa de descomposición de valores singulares
  • Modelado de tópicos y recuperación de información usando análisis semántico latente

8. Extracción de Entidades, Análisis de Sentimientos y Modelado de Temas Avanzado

  • Positivo vs. negativo: grado de sentimiento
  • Teoría de respuestas de elementos
  • Parte del etiquetado de voz y su aplicación: encontrar personas, lugares y organizaciones mencionados en el texto
  • Modelado de temas avanzados: asignación de Dirichlet latente

9. Estudios de caso

  • Minería de usuarios no estructurados opiniones
  • Clasificación de sentimientos y visualización de datos de revisión de productos
  • Registros de búsqueda minera para patrones de uso
  • Clasificación del texto
  • Modelado de temas

Requerimientos

Conocimiento y conocimiento de los principios de PNL y una apreciación de la aplicación de IA en los negocios
 

 21 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Robots Inteligentes para Desarrolladores

84 horas

Categorías Relacionadas