Programa del Curso
Esquema de entrenamiento detallado
1. Introducción a NLP
- Comprender PNL
- Marcos NLP
- Aplicaciones comerciales de NLP
- Recortando datos de la web
- Trabajando con varias API para recuperar datos de texto
- Trabajo y almacenamiento de contenido de texto de las corporaciones que guarda contenido y metadatos relevantes
- Ventajas de usar el curso intensivo de Python y NLTK
2. Comprensión práctica de un corpus y conjunto de datos
- ¿Por qué necesitamos un corpus?
- Análisis de Corpus
- Tipos de atributos de datos
- Diferentes formatos de archivo para corpora
- Preparación de un conjunto de datos para aplicaciones NLP
3, Comprender la estructura de una oración
- Componentes de NLP
- Comprensión del lenguaje natural
- Análisis morfológico - stem, word, token, etiquetas de voz
- Análisis sintáctico
- Análisis semántico
- Manejando ambigiuty
4. Preprocesamiento de datos de texto
- Corpus- texto sin formato
- Tokenización de oraciones
- Stemming para texto sin formato
- Lemización del texto sin formato
- Detener la eliminación de palabras
- Oraciones de corpus-raw
- Word tokenization
- Palabra lematización
- Trabajar con matrices Término-Documento / Documento-Término
- Tokenización de texto en n-grams y oraciones
- Preprocesamiento práctico y personalizado
5. Analizando datos de texto
- Característica básica de NLP
- Analizadores y análisis
- Etiquetado POS y taggers
- Nombre reconocimiento de entidad
- N-grams
- Bolsa de palabras
- Características estadísticas de PNL
- Conceptos de álgebra lineal para PNL
- Teoría probabilística para PNL
- TF-IDF
- Vectorización
- Encoders and Decoders
- Normalización
- Modelos probabilísticos
- Ingeniería de características avanzadas y PNL
- Conceptos básicos de word2vec
- Componentes del modelo word2vec
- Lógica del modelo word2vec
- Extensión del concepto de word2vec
- Aplicación del modelo word2vec
- Estudio de caso: aplicación de una bolsa de palabras: resumen automático de texto usando algoritmos de Luhn simplificados y verdaderos
6. Agrupación de documentos, clasificación y modelado de temas
- Agrupación de documentos y minería de patrones (agrupación jerárquica, k-medias, agrupamiento, etc.)
- Comparación y clasificación de documentos utilizando medidas de distancia de TFIDF, Jaccard y coseno
- Clasificación de documentos usando Naïve Bayes y Maximum Entropy
7. Identificar elementos de texto importantes
- Reducción de la dimensionalidad: análisis de componentes principales, factorización de la descomposición no negativa de descomposición de valores singulares
- Modelado de tópicos y recuperación de información usando análisis semántico latente
8. Extracción de Entidades, Análisis de Sentimientos y Modelado de Temas Avanzado
- Positivo vs. negativo: grado de sentimiento
- Teoría de respuestas de elementos
- Parte del etiquetado de voz y su aplicación: encontrar personas, lugares y organizaciones mencionados en el texto
- Modelado de temas avanzados: asignación de Dirichlet latente
9. Estudios de caso
- Minería de usuarios no estructurados opiniones
- Clasificación de sentimientos y visualización de datos de revisión de productos
- Registros de búsqueda minera para patrones de uso
- Clasificación del texto
- Modelado de temas
Requerimientos
Conocimiento y conocimiento de los principios de PNL y una apreciación de la aplicación de IA en los negocios
Testimonios (2)
Good conceptual explanations followed by good example exercises
Appu Hannadi Thotahewage Eranga De Silva - University of New South Wales, Sydney
Curso - ROS: Programming for Robotics
Ejercicios e intercambios durante las preguntas y respuestas
Antoine - Physiobotic
Curso - Scaling Data Pipelines with Spark NLP
Traducción Automática