Programa del Curso

Desglose de temas diarios: (Cada sesión es de 2 horas)

Día-1: Sesión -1: Visión general del negocio de por qué Big Data Business Intelligence en las telecomunicaciones.

  • Estudios de casos de T-Mobile, Verizon, etc.
  • Tasa de adaptación de Big Data en las empresas de telecomunicaciones de América del Norte y cómo están alineando su futuro modelo de negocio y operación en torno a Big Data BI
  • Área de aplicación a gran escala
  • Gestión de redes y servicios
  • Abandono de clientes Management
  • Integración de datos y visualización de cuadros de mando
  • Gestión del fraude
  • Generación de reglas de negocio
  • Elaboración de perfiles de clientes
  • Envío de anuncios localizados

Día-1: Sesión-2 : Introducción de Big Data-1

  • Principales características del Big Data: volumen, variedad, velocidad y veracidad. Arquitectura MPP para el volumen.
  • Almacenes de datos: esquema estático, conjunto de datos que evoluciona lentamente
  • Bases de datos MPP como Greenplum, Exadata, Teradata, Netezza, Vertica, etc.
  • Soluciones basadas en Hadoop: no hay condiciones en la estructura del conjunto de datos.
  • Patrón típico: HDFS, MapReduce (crunch), recuperar de HDFS
  • Por lotes: adecuado para análisis / no interactivo
  • Volumen : Datos de transmisión de CEP
  • Opciones típicas: productos CEP (por ejemplo, Infostreams, Apama, MarkLogic, etc.)
  • Menos producción lista – Storm/S4
  • Bases de datos NoSQL (en columnas y clave-valor): Más adecuadas como complemento analítico para el almacén de datos/base de datos

Día-1 : Sesión -3 : Introducción a Big Data-2

NoSQL soluciones

  • KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • Tienda KV - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • Almacén KV (Jerárquico) - GT.m, Caché
  • Tienda KV (Ordenada) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
  • KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
  • Tienda de tuplas - Gigaspaces, Coord, Apache River
  • Base de datos de objetos: ZopeDB, DB40, Shoal
  • Almacén de documentos: CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • Amplio almacén en columnas: BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Variedades de datos: Introducción al tema Data Cleaning en Big Data

  • RDBMS: estructura/esquema estático, no promueve un entorno ágil y exploratorio.
  • NoSQL – semiestructurado, estructura suficiente para almacenar datos sin un esquema exacto antes de almacenar datos
  • Problemas de limpieza de datos

Día-1 : Sesión-4 : Introducción a Big Data-3 : Hadoop

  • ¿Cuándo seleccionar Hadoop?
  • ESTRUCTURADO: los almacenes/bases de datos empresariales pueden almacenar datos masivos (a un costo) pero imponer una estructura (no es bueno para la exploración activa)
  • Datos ESTRUCTURADOS SEMI: difíciles de hacer con las soluciones tradicionales (DW/DB)
  • Datos de almacenamiento = ENORME esfuerzo y estática incluso después de la implementación
  • Para variedad y volumen de datos, procesados en hardware básico – HADOOP
  • Commodity H/W necesario para crear un Hadoop clúster

Introducción a Map Reduce /HDFS

  • MapReduce: distribuya la informática en varios servidores
  • HDFS: hacer que los datos estén disponibles localmente para el proceso informático (con redundancia)
  • Datos: pueden ser no estructurados o sin esquema (a diferencia de RDBMS)
  • Responsabilidad del desarrollador para dar sentido a los datos
  • Programming MapReduce = trabajar con Java (pros/contras), carga manual de datos en HDFS

Día 2: Sesión 1.1: Spark : Base de datos distribuida en memoria

  • ¿Qué es el procesamiento "en memoria"?
  • Chispa SQL
  • Spark SDK
  • Spark API
  • RDD
  • Liberación de chispas
  • Hanna
  • Cómo migrar un sistema Hadoop existente a Spark

Día-2 Sesión -1.2: Tormenta -Procesamiento en tiempo real en Big Data

  • Arroyos
  • Brotes
  • Pernos
  • Topologías

Día-2: Sesión-2: Sistema Big Data Management

  • Piezas móviles, nodos de cómputo de inicio/fallo: ZooKeeper: para servicios de configuración/coordinación/nomenclatura
  • Canalización/flujo de trabajo complejo: Oozie: gestiona el flujo de trabajo, las dependencias y la conexión en cadena
  • Implementar, configurar, administrar clústeres, actualizar, etc. (administrador de sistemas): Ambari
  • En la nube : Whirr
  • Evolución Big Data de las herramientas de la plataforma para el seguimiento
  • Problemas de aplicación de la capa ETL

Día-2: Sesión-3: Analítica predictiva en Business Intelligence -1: Técnicas fundamentales y BI basado en aprendizaje automático:

  • Introducción al aprendizaje automático
  • Aprendizaje de técnicas de clasificación
  • Archivo de entrenamiento de preparación de predicción bayesiana
  • Campo aleatorio de Markov
  • Aprendizaje supervisado y no supervisado
  • Extracción de características
  • Máquina de vectores de soporte
  • Red neuronal
  • Aprendizaje por refuerzo
  • Big Data Problema de variable grande -Bosque aleatorio (RF)
  • Aprendizaje de la representación
  • Aprendizaje profundo
  • Big Data Problema de automatización: RF de conjunto multimodelo
  • Automatización a través de Soft10-M
  • LDA y modelado de temas
  • Aprendizaje ágil
  • Aprendizaje basado en agentes: ejemplo de operación de telecomunicaciones
  • Aprendizaje distribuido: ejemplo de funcionamiento de la empresa de telecomunicaciones
  • Introducción a las herramientas de código abierto para el análisis predictivo : R, Rapidminer, Mahut
  • Laboratorio de análisis de Hama, Spark y CMU Graph más escalable

Día-2: Sesión-4 Ecosistema de analítica predictiva-2: Problemas comunes de analítica predictiva en Telecom

  • Analítica de información
  • Analítica de visualización
  • Análisis predictivo estructurado
  • Analítica predictiva no estructurada
  • Elaboración de perfiles de clientes
  • Motor de recomendaciones
  • Detección de patrones
  • Descubrimiento de reglas/escenarios: fallo, fraude, optimización
  • Descubrimiento de la causa raíz
  • Análisis de sentimiento
  • Analítica de CRM
  • Análisis de redes
  • Análisis de texto
  • Revisión asistida por tecnología
  • Análisis de fraude
  • Analítica en tiempo real

Día-3 : Sesión-1 : Análisis de la operación de la red: análisis de la causa raíz de las fallas de la red, interrupción del servicio a partir de metadatos, IPDR y CRM:

  • Uso de CPU
  • Uso de memoria
  • Uso de la cola de QoS
  • Temperatura del dispositivo
  • Error de interfaz
  • Versiones de IoS
  • Eventos de enrutamiento
  • Variaciones de latencia
  • Análisis de Syslog
  • Pérdida de paquetes
  • Simulación de carga
  • Inferencia de topología
  • Umbral de rendimiento
  • Trampas de dispositivos
  • Recopilación y procesamiento de IPDR (registro detallado de IP)
  • Uso de datos IPDR para el consumo de ancho de banda del suscriptor, la utilización de la interfaz de red, el estado del módem y el diagnóstico
  • Información sobre HFC

Día-3: Sesión-2: Herramientas para el análisis de fallos del servicio de red:

  • Panel de resumen de red: supervise las implementaciones generales de la red y realice un seguimiento de los indicadores clave de rendimiento de su organización
  • Panel de análisis de período pico: comprenda las tendencias de la aplicación y los suscriptores que impulsan la utilización máxima, con granularidad específica de la ubicación
  • Panel de eficiencia de enrutamiento: controle los costos de la red y cree casos de negocio para proyectos de capital con una comprensión completa de las relaciones de interconexión y tránsito
  • Panel de entretenimiento en tiempo real: acceda a las métricas que importan, incluidas las visualizaciones de vídeo, la duración y la calidad de la experiencia de vídeo (QoE)
  • Panel de control de transición a IPv6: investigue la adopción continua de IPv6 en su red y obtenga información sobre las aplicaciones y los dispositivos que impulsan las tendencias
  • Caso práctico 1: El minero de datos Big Network Analytics (BNA) de Alcatel-Lucent
  • Inteligencia móvil multidimensional (m.IQ6)

Día-3 : Sesión 3: Big Data BI para Marketing/Ventas –Comprensión de las ventas/marketing a partir de los datos de ventas: (Todos ellos se mostrarán con una demostración analítica predictiva en vivo)

  • Para identificar los clientes de mayor velocidad
  • Identificar clientes para un determinado producto
  • Identificar el conjunto correcto de productos para un cliente (motor de recomendación)
  • Técnica de segmentación de mercado
  • Técnica de venta cruzada y venta adicional
  • Técnica de segmentación de clientes
  • Técnica de previsión de ingresos por ventas

Día-3: Sesión 4: BI necesario para la oficina del CFO de telecomunicaciones:

  • Descripción general de Business Trabajos de análisis necesarios en una oficina de CFO
  • Análisis de riesgos en nuevas inversiones
  • Previsión de ingresos y beneficios
  • Previsión de adquisición de nuevos clientes
  • Previsión de pérdidas
  • Análisis de fraude en las finanzas ( detalles próxima sesión )

Día-4 : Sesión-1: BI de prevención de fraude desde Big Data en Telco-Fraud analytic:

  • Fuga de ancho de banda / Fraude de ancho de banda
  • Fraude de proveedores/cobro excesivo por proyectos
  • Fraudes de reembolsos/reclamaciones de clientes
  • Fraudes en el reembolso de viajes

Día-4 : Sesión-2: De la predicción de la pérdida de clientes a la prevención de la pérdida de clientes:

  • 3 tipos de abandono: activo/deliberado, rotativo/incidental, pasivo involuntario
  • 3 Clasificación de clientes abandonados: Total, Oculto, Parcial
  • Descripción de las variables de CRM para la pérdida de clientes
  • Recopilación de datos sobre el comportamiento del cliente
  • Recopilación de datos de percepción del cliente
  • Recopilación de datos demográficos de los clientes
  • Limpieza de datos de CRM
  • Datos no estructurados de CRM (llamadas de clientes, tickets, correos electrónicos) y su conversión en datos estructurados para el análisis de Churn
  • Social Media CRM: nueva forma de extraer el índice de satisfacción del cliente
  • Estudio de caso-1 : T-Mobile USA: Reducción de la pérdida de clientes en un 50%

Día-4 : Sesión-3: Cómo utilizar el análisis predictivo para el análisis de la causa raíz de la insatisfacción del cliente:

  • Estudio de caso -1 : Vinculación de la insatisfacción con los problemas - Contabilidad, Fallas de ingeniería como interrupción del servicio, servicio de ancho de banda deficiente
  • Estudio de caso 2: Big Data Panel de control de calidad para realizar un seguimiento del índice de satisfacción del cliente a partir de varios parámetros, como escalamientos de llamadas, criticidad de problemas, eventos pendientes de interrupción del servicio, etc.

Día-4: Sesión-4: Big Data Panel de control para un rápido acceso a diversos datos y visualización:

  • Integración de la plataforma de aplicaciones existente con Big Data Dashboard
  • Gestión de Big Data
  • Estudio de caso de Big Data Dashboard: Tableau y Pentaho
  • Utilice la aplicación Big Data para impulsar la publicidad basada en la ubicación
  • Sistema de seguimiento y gestión

Día-5 : Sesión-1: Cómo justificar Big Data la implementación de BI dentro de una organización:

  • Definición del ROI para la implementación Big Data
  • Casos prácticos para ahorrar tiempo a los analistas en la recopilación y preparación de datos: aumento de la productividad
  • Casos prácticos de aumento de ingresos por abandono de clientes
  • Aumento de ingresos de anuncios basados en la ubicación y otros anuncios dirigidos
  • Un enfoque de hoja de cálculo integrado para calcular aprox. gastos frente a ganancias/ahorros de ingresos de Big Data implementación.

Día-5 : Sesión-2: Procedimiento paso a paso para reemplazar el sistema de datos heredado a Big Data Sistema:

  • Comprensión práctica Big Data de la hoja de ruta de la migración
  • ¿Cuál es la información importante que se necesita antes de diseñar una implementación Big Data
  • ¿Cuáles son las diferentes formas de calcular el volumen, la velocidad, la variedad y la veracidad de los datos?
  • Cómo estimar el crecimiento de los datos
  • Casos de estudio en 2 Telco

Día-5: Sesión 3 y 4: Revisión de Big Data Proveedores y revisión de sus productos. Sesión de preguntas y respuestas:

  • AccentureAlcatel-Lucent
  • Amazonas –A9
  • APTEAN (anteriormente software de los CDC)
  • Sistemas Cisco
  • Cloudera
  • Dell
  • EMC
  • Corporación GoodData
  • Guavus
  • Sistemas de datos de Hitachi
  • Hortonworks
  • Huawei
  • HP
  • IBM
  • Informatica
  • Intel
  • Jaspersoft
  • Microsoft
  • MongoDB (anteriormente 10Gen)
  • MU Sigma
  • Netapp
  • Soluciones de Opera
  • Oráculo
  • Pentaho
  • Platfora
  • Qliktech
  • Cuanto
  • Espacio en rack
  • Análisis de Revolution
  • Ventas de ventas
  • SAVIA
  • Instituto SAS
  • Sisense
  • Software AG/Terracotta
  • Automatización de Soft10
  • Splunk
  • Sqrrl
  • Supermicro
  • Tableau Software
  • Teradata
  • Piensa en grande en analítica
  • Sistemas de señalización de mareas
  • VMware (Parte de EMC)

Requerimientos

  • Debe tener conocimientos básicos de funcionamiento empresarial y sistemas de datos en Telecom en su dominio
  • Debe tener conocimientos básicos de SQL/Oracle o bases de datos relacionales
  • Conocimientos básicos de Estadística (en niveles de Excel)
  35 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (3)

Cursos Relacionados

Categorías Relacionadas