Programa del Curso
Introducción
Instalación y Configuración de Dataiku Data Science Studio (DSS)
- Requisitos del sistema para Dataiku DSS
- Configuración de integraciones con Apache Hadoop y Apache Spark
- Configuración de Dataiku DSS con proxies web
- Migración desde otras plataformas a Dataiku DSS
Visión General de las Características y Arquitectura de Dataiku DSS
- Objetos y gráficos fundamentales en Dataiku DSS
- ¿Qué es una receta en Dataiku DSS?
- Tipos de conjuntos de datos soportados por Dataiku DSS
Creación de un Proyecto de Dataiku DSS
Definición de Conjuntos de Datos para Conectar a Recursos de Datos en Dataiku DSS
- Trabajo con conectores y formatos de archivo de DSS
- Formatos estándar de DSS frente a formatos específicos de Hadoop
- Carga de archivos para un proyecto de Dataiku DSS
Visión General del Sistema de Archivos del Servidor en Dataiku DSS
Creación y Uso de Carpetas Administradas
- Receta de Dataiku DSS para fusionar carpetas
- Carpetas administradas locales frente a no locales
Construcción de un Conjunto de Datos del Sistema de Archivos Usando el Contenido de Carpetas Administradas
- Realización de limpiezas con una receta de código de DSS
Trabajo con Conjuntos de Datos Métricos y Conjuntos de Datos de Estadísticas Internas
Implementación de la Receta de Descarga de DSS para el Conjunto de Datos HTTP
Reubicación de Conjuntos de Datos SQL y HDFS Usando DSS
Ordenación de Conjuntos de Datos en Dataiku DSS
- Ordenación del escritor frente a ordenación en tiempo de lectura
Exploración y Preparación de Visualizaciones de Datos para un Proyecto de Dataiku DSS
Visión General de Esquemas, Tipos de Almacenamiento y Significados en Dataiku
Realización de Scripts de Limpieza, Normalización y Enriquecimiento de Datos en Dataiku DSS
Trabajo con la Interfaz de Gráficos de Dataiku DSS y Tipos de Agregaciones Visuales
Utilización de la Función de Estadísticas Interactivas de DSS
- Análisis univariado frente a análisis bivariado
- Uso del herramienta PCA (Análisis de Componentes Principales) de DSS
Visión General del Aprendizaje Automático con Dataiku DSS
- Aprendizaje supervisado frente a aprendizaje no supervisado
- Referencias para algoritmos y manejo de características de ML en DSS
- Aprendizaje profundo con Dataiku DSS
Visión General del Flujo Derivado de Conjuntos de Datos y Recetas de DSS
Transformación de Conjuntos de Datos Existentes en DSS con Recetas Visuales
Utilización de Recetas de DSS Basadas en Código Definido por el Usuario
Optimización de la Exploración y Experimentación de Código con Cuadernos de Código de DSS
Escritura de Visualizaciones Avanzadas y Características Frontend Personalizadas con Webapps en DSS
Trabajo con la Función de Informes de Código de Dataiku DSS
Compartir Elementos del Proyecto de Datos y Familiarización con el Tablero de DSS
Diseño y Empaquetado de un Proyecto de Dataiku DSS como Aplicación Reutilizable
Visión General de Métodos Avanzados en Dataiku DSS
- Implementación de particionamiento optimizado de conjuntos de datos usando DSS
- Ejecución de partes específicas del procesamiento de DSS a través de cálculos en contenedores de Kubernetes
Visión General de Colaboración y Control de Versiones en Dataiku DSS
Implementación de Escenarios de Automatización, Métricas y Verificaciones para la Prueba de Proyectos de DSS
Despliegue y Actualización de un Proyecto con el Nodo de Automatización de DSS y Bundles
Trabajo con APIs en Tiempo Real en Dataiku DSS
- APIs adicionales y Rest APIs en DSS
Análisis y Pronóstico de Series Temporales de Dataiku DSS
Seguridad de un Proyecto en Dataiku DSS
- Administración de permisos del proyecto y autorizaciones del tablero
- Implementación de opciones de seguridad avanzadas
Integración de Dataiku DSS con la Nube
Solución de Problemas
Resumen y Conclusión
Requerimientos
- Experiencia con los lenguajes de programación Python, SQL y R
- Conocimientos básicos de procesamiento de datos con Apache Hadoop y Spark
- Comprensión de conceptos de aprendizaje automático y modelos de datos
- Antecedentes en análisis estadísticos y conceptos de ciencia de datos
- Experiencia en visualización y comunicación de datos
Público objetivo
- Ingenieros
- Científicos de datos
- Analistas de datos