Temario del curso

Introducción

  • Visión general de Databricks y Apache Spark
  • Comprensión de la arquitectura de Databricks

Comenzando

  • Configuración del entorno
  • Configuración e instalación de Databricks
  • Navegación en la interfaz de usuario de Databricks
  • Creación de un espacio de trabajo de Databricks

Trabajando con datos en Databricks

  • Conexión a una fuente de datos de Apache Spark
  • Comprensión de las columnas y tipos de datos básicos
  • Gestión del sistema de archivos en Notebooks

Gestión de trabajos y clústeres

  • Creación y configuración de clústeres
  • Creación de trabajos usando Notebooks
  • Ejecución de trabajos
  • Visualización de trabajos y detalles de los trabajos

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake
  • Gestión de datos en Delta Lake

Seguridad en Databricks

  • Gestión de la seguridad de Databricks
  • Gestión de copias de seguridad y recuperación

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de análisis de datos
  • Conocimiento de Apache Spark

Audiencia

  • Ingenieros de Datos
  • Científicos de Datos
  • Desarrolladores
 14 Horas

Formación Corporativa a Medida

Soluciones de formación diseñadas exclusivamente para empresas.

  • Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
  • Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
  • Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.
Inversión

Precio por grupo privado (formación online) desde 3200 € + IVA*

Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales

Testimonios (1)

Próximos cursos

Categorías Relacionadas