Capacitación de Administrador para Apache Hadoop

Audiencia:

El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido

Gol:

Conocimiento profundo sobre administración de clúster de Hadoop.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

1: HDFS (17%)

Describir la función de Daemons HDFS
Describir el funcionamiento normal de un clúster Apache Hadoop, tanto en el almacenamiento de datos como en el procesamiento de datos.
Identificar las características actuales de los sistemas informáticos que motivan un sistema como Apache Hadoop.
Clasifique los objetivos principales del diseño de HDFS
Dado un escenario, identifique el caso de uso apropiado para la Federación HDFS
Identificar los componentes y el daemon de un clúster HDFS HA-Quorum
Analizar el papel de la seguridad HDFS (Kerberos)
Determinar la mejor opción de serialización de datos para un escenario dado
Describir rutas de lectura y escritura de archivos
Identificar los comandos para manipular archivos en el Shell del sistema de archivos Hadoop

2: YARN y MapReduce versión 2 (MRv2) (17%)

Comprender cómo la actualización de un clúster de Hadoop 1 a Hadoop 2 afecta a la configuración del clúster
Entender cómo implementar MapReduce v2 (MRv2 / YARN), incluyendo todos los daemons YARN
Entender la estrategia básica de diseño de MapReduce v2 (MRv2)
Determinar cómo YARN gestiona las asignaciones de recursos
Identificar el flujo de trabajo de MapReduce que se ejecuta en YARN
Determine qué archivos debe cambiar y cómo migrar un clúster de MapReduce versión 1 (MRv1) a MapReduce versión 2 (MRv2) que se ejecuta en YARN.

3: Hadoop Cluster Planning (16%)

Principales puntos a considerar al elegir el hardware y los sistemas operativos para alojar un clúster Apache Hadoop.
Analizar las opciones al seleccionar un sistema operativo
Comprender la afinación del núcleo y el intercambio de discos
Dado un escenario y un patrón de carga de trabajo, identifique una configuración de hardware adecuada al escenario
Dado un escenario, determine los componentes del ecosistema que su clúster necesita ejecutar para cumplir con el SLA
Dimensionamiento del clúster: dado el escenario y la frecuencia de ejecución, identifique los detalles de la carga de trabajo, incluyendo CPU, memoria, almacenamiento, E / S de disco
Tamaño y configuración del disco, incluidos JBOD frente a RAID, SAN, virtualización y requisitos de tamaño de disco en un clúster
Topologías de red: comprender el uso de la red en Hadoop (para HDFS y MapReduce) y proponer o identificar componentes clave de diseño de red para un escenario dado

4: Instalación y administración de clústeres Hadoop (25%)

Dado un escenario, identifique cómo el clúster manejará fallas de disco y máquina
Analizar una configuración de registro y registrar el formato de archivo de configuración
Comprender los conceptos básicos de las métricas de Hadoop y el monitoreo de la salud de los clústeres
Identificar la función y el propósito de las herramientas disponibles para el monitoreo de clusters
Ser capaz de instalar todos los componentes del ecosistema en CDH 5, incluyendo (pero no limitado a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive y Pig
Identificar la función y el propósito de las herramientas disponibles para administrar el sistema de archivos Apache Hadoop

5: Gestión de recursos (10%)

Entender los objetivos generales de diseño de cada uno de los planificadores de Hadoop
Dado un escenario, determine cómo el Planificador FIFO asigna recursos de clúster
Dado un escenario, determine cómo el planificador justo asigna los recursos del clúster bajo YARN
Dado un escenario, determine cómo el Programador de capacidad asigna recursos de clúster

6: Monitoreo y registro (15%)

Comprender las funciones y características de las capacidades de recopilación de métricas de Hadoop
Analizar las interfaces de usuario de Web de NameNode y JobTracker
Entender cómo supervisar demonios de clúster
Identificar y supervisar el uso de la CPU en los nodos maestros
Describir cómo supervisar la asignación de intercambio y memoria en todos los nodos
Identificar cómo ver y administrar los archivos de registro de Hadoop
Interpretar un archivo de registro

Requerimientos

Habilidades básicas de administración de Linux
Habilidades básicas de programación

35 Horas

¿Necesita ayuda para elegir el curso adecuado?

Testimonios (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Traducción Automática

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Traducción Automática

I mostly liked the trainer giving real live Examples.

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Traducción Automática

Capacitación de Administrador para Apache Hadoop

Audiencia:

Gol:

Temario del curso

1: HDFS (17%)

2: YARN y MapReduce versión 2 (MRv2) (17%)

3: Hadoop Cluster Planning (16%)

4: Instalación y administración de clústeres Hadoop (25%)

5: Gestión de recursos (10%)

6: Monitoreo y registro (15%)

Requerimientos

Testimonios (3)

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Próximos cursos

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Capacitación de Administrador para Apache Hadoop

Audiencia:

Gol:

Temario del curso

1: HDFS (17%)

2: YARN y MapReduce versión 2 (MRv2) (17%)

3: Hadoop Cluster Planning (16%)

4: Instalación y administración de clústeres Hadoop (25%)

5: Gestión de recursos (10%)

6: Monitoreo y registro (15%)

Requerimientos

Testimonios (3)

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Próximos cursos

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Cursos Relacionados

Programación con Big Data en R

Fundamentos de R

Econometría: Eviews y Simuladores de Riesgo

Pronosticar con R

Analítica de RRHH para Organizaciones Públicas

Análisis de Marketing con R

Público objetivo

Descripción general

Formato

R para Análisis de Datos e Investigación

Audiencia

Formato del curso

Introducción a R

Introducción R para Biólogos

R

Red Neuronal en R

Programación Avanzada de R

Análisis Estadístico Mediante SPSS

Introducción a la visualización de datos con Tidyverse y R

Creación de Aplicaciones Web en R con Shiny

Descripción:

Objetivo:

Categorías Relacionadas

Hadoop

Estadísticas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites