Programa del Curso

Introducción

Instalación y Configuración de Dataiku Data Science Studio (DSS)

  • Requisitos del sistema para Dataiku DSS
  • Configuración de integraciones con Apache Hadoop y Apache Spark
  • Configuración de Dataiku DSS con proxies web
  • Migración desde otras plataformas a Dataiku DSS

Visión General de las Características y Arquitectura de Dataiku DSS

  • Objetos y gráficos fundamentales en Dataiku DSS
  • ¿Qué es una receta en Dataiku DSS?
  • Tipos de conjuntos de datos soportados por Dataiku DSS

Creación de un Proyecto de Dataiku DSS

Definición de Conjuntos de Datos para Conectar a Recursos de Datos en Dataiku DSS

  • Trabajo con conectores y formatos de archivo de DSS
  • Formatos estándar de DSS frente a formatos específicos de Hadoop
  • Carga de archivos para un proyecto de Dataiku DSS

Visión General del Sistema de Archivos del Servidor en Dataiku DSS

Creación y Uso de Carpetas Administradas

  • Receta de Dataiku DSS para fusionar carpetas
  • Carpetas administradas locales frente a no locales

Construcción de un Conjunto de Datos del Sistema de Archivos Usando el Contenido de Carpetas Administradas

  • Realización de limpiezas con una receta de código de DSS

Trabajo con Conjuntos de Datos Métricos y Conjuntos de Datos de Estadísticas Internas

Implementación de la Receta de Descarga de DSS para el Conjunto de Datos HTTP

Reubicación de Conjuntos de Datos SQL y HDFS Usando DSS

Ordenación de Conjuntos de Datos en Dataiku DSS

  • Ordenación del escritor frente a ordenación en tiempo de lectura

Exploración y Preparación de Visualizaciones de Datos para un Proyecto de Dataiku DSS

Visión General de Esquemas, Tipos de Almacenamiento y Significados en Dataiku

Realización de Scripts de Limpieza, Normalización y Enriquecimiento de Datos en Dataiku DSS

Trabajo con la Interfaz de Gráficos de Dataiku DSS y Tipos de Agregaciones Visuales

Utilización de la Función de Estadísticas Interactivas de DSS

  • Análisis univariado frente a análisis bivariado
  • Uso del herramienta PCA (Análisis de Componentes Principales) de DSS

Visión General del Aprendizaje Automático con Dataiku DSS

  • Aprendizaje supervisado frente a aprendizaje no supervisado
  • Referencias para algoritmos y manejo de características de ML en DSS
  • Aprendizaje profundo con Dataiku DSS

Visión General del Flujo Derivado de Conjuntos de Datos y Recetas de DSS

Transformación de Conjuntos de Datos Existentes en DSS con Recetas Visuales

Utilización de Recetas de DSS Basadas en Código Definido por el Usuario

Optimización de la Exploración y Experimentación de Código con Cuadernos de Código de DSS

Escritura de Visualizaciones Avanzadas y Características Frontend Personalizadas con Webapps en DSS

Trabajo con la Función de Informes de Código de Dataiku DSS

Compartir Elementos del Proyecto de Datos y Familiarización con el Tablero de DSS

Diseño y Empaquetado de un Proyecto de Dataiku DSS como Aplicación Reutilizable

Visión General de Métodos Avanzados en Dataiku DSS

  • Implementación de particionamiento optimizado de conjuntos de datos usando DSS
  • Ejecución de partes específicas del procesamiento de DSS a través de cálculos en contenedores de Kubernetes

Visión General de Colaboración y Control de Versiones en Dataiku DSS

Implementación de Escenarios de Automatización, Métricas y Verificaciones para la Prueba de Proyectos de DSS

Despliegue y Actualización de un Proyecto con el Nodo de Automatización de DSS y Bundles

Trabajo con APIs en Tiempo Real en Dataiku DSS

  • APIs adicionales y Rest APIs en DSS

Análisis y Pronóstico de Series Temporales de Dataiku DSS

Seguridad de un Proyecto en Dataiku DSS

  • Administración de permisos del proyecto y autorizaciones del tablero
  • Implementación de opciones de seguridad avanzadas

Integración de Dataiku DSS con la Nube

Solución de Problemas

Resumen y Conclusión

Requerimientos

  • Experiencia con los lenguajes de programación Python, SQL y R
  • Conocimientos básicos de procesamiento de datos con Apache Hadoop y Spark
  • Comprensión de conceptos de aprendizaje automático y modelos de datos
  • Antecedentes en análisis estadísticos y conceptos de ciencia de datos
  • Experiencia en visualización y comunicación de datos

Público objetivo

  • Ingenieros
  • Científicos de datos
  • Analistas de datos
 21 Horas

Próximos cursos

Categorías Relacionadas