Programación de GPU - OpenCL vs CUDA vs ROCm

La programación de GPU es una técnica que aprovecha el poder de procesamiento paralelo de las GPUs para acelerar aplicaciones que requieren computación de alto rendimiento, como la inteligencia artificial, los juegos, gráficos y computación científica. Existen varios marcos que permiten la programación de GPU, cada uno con sus propias ventajas y desventajas. OpenCL es un estándar abierto que se puede usar para programar CPUs, GPUs y otros dispositivos de diferentes proveedores, mientras que CUDA es específico de las GPUs NVIDIA. ROCm es una plataforma que admite la programación de GPU en GPUs AMD y también proporciona compatibilidad con CUDA y OpenCL.

Este entrenamiento dirigido por un instructor (en línea o presencial) está destinado a desarrolladores de nivel principiante a intermedio que deseen usar diferentes marcos para la programación de GPU y comparar sus características, rendimiento y compatibilidad.

Al final de este entrenamiento, los participantes serán capaces de:

Configurar un entorno de desarrollo que incluya el SDK de OpenCL, la CUDA Toolkit, la plataforma ROCm, un dispositivo que soporte OpenCL, CUDA o ROCm, y Visual Studio Code.
Crear un programa básico de GPU que realice una suma vectorial utilizando OpenCL, CUDA y ROCm, y comparar la sintaxis, estructura y ejecución de cada marco.
Usar las respectivas API para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos.
Usar los respectivos lenguajes para escribir kernels que se ejecuten en el dispositivo y manipulen datos.
Usar las funciones, variables y bibliotecas integradas de cada marco para realizar tareas y operaciones comunes.
Utilizar los espacios de memoria respectivos, como global, local, constante y privado, para optimizar las transferencias de datos y el acceso a la memoria.
Usar los modelos de ejecución respectivos para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
Depurar y probar programas de GPU utilizando herramientas como CodeXL, CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight.
Optimizar programas de GPU usando técnicas como la coalescencia, el caché, la preextracción y el perfilado.

Formato del Curso

Conferencia interactiva y discusión.
Muchos ejercicios y práctica.
Implementación práctica en un entorno de laboratorio en vivo.

Opciones de Personalización del Curso

Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Introducción

¿Qué es la programación de GPU?
¿Por qué usar la programación de GPU?
¿Cuáles son los desafíos y compromisos de la programación de GPU?
¿Qué marcos existen para la programación de GPU?
Elegir el marco adecuado para tu aplicación

OpenCL

¿Qué es OpenCL?
¿Cuáles son las ventajas y desventajas de OpenCL?
Configuración del entorno de desarrollo para OpenCL
Crear un programa básico de OpenCL que realice una suma vectorial
Usar la API de OpenCL para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
Usar el lenguaje C de OpenCL para escribir kernels que se ejecuten en el dispositivo y manipulen datos
Usar las funciones, variables y bibliotecas integradas de OpenCL para realizar tareas y operaciones comunes
Utilizar los espacios de memoria de OpenCL, como global, local, constante y privado, para optimizar las transferencias de datos y el acceso a la memoria
Usar el modelo de ejecución de OpenCL para controlar los work-items, work-groups y ND-ranges que definen el paralelismo
Depurar y probar programas de OpenCL usando herramientas como CodeXL
Optimizar programas de OpenCL utilizando técnicas como la coalescencia, el caché, la preextracción y el perfilado

CUDA

¿Qué es CUDA?
¿Cuáles son las ventajas y desventajas de CUDA?
Configuración del entorno de desarrollo para CUDA
Crear un programa básico de CUDA que realice una suma vectorial
Usar la API de CUDA para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
Usar el lenguaje C/C++ de CUDA para escribir kernels que se ejecuten en el dispositivo y manipulen datos
Usar las funciones, variables y bibliotecas integradas de CUDA para realizar tareas y operaciones comunes
Utilizar los espacios de memoria de CUDA, como global, shared, constante y local, para optimizar las transferencias de datos y el acceso a la memoria
Usar el modelo de ejecución de CUDA para controlar los hilos, bloques y cuadrículas que definen el paralelismo
Depurar y probar programas de CUDA usando herramientas como CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight
Optimizar programas de CUDA utilizando técnicas como la coalescencia, el caché, la preextracción y el perfilado

ROCm

¿Qué es ROCm?
¿Cuáles son las ventajas y desventajas de ROCm?
Configuración del entorno de desarrollo para ROCm
Crear un programa básico de ROCm que realice una suma vectorial
Usar la API de ROCm para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
Usar el lenguaje C/C++ de ROCm para escribir kernels que se ejecuten en el dispositivo y manipulen datos
Usar las funciones, variables y bibliotecas integradas de ROCm para realizar tareas y operaciones comunes
Utilizar los espacios de memoria de ROCm, como global, local, constante y privado, para optimizar las transferencias de datos y el acceso a la memoria
Usar el modelo de ejecución de ROCm para controlar los hilos, bloques y cuadrículas que definen el paralelismo
Depurar y probar programas de ROCm usando herramientas como ROCm Debugger y ROCm Profiler
Optimizar programas de ROCm utilizando técnicas como la coalescencia, el caché, la preextracción y el perfilado

Comparación

Comparar las características, rendimiento y compatibilidad de OpenCL, CUDA y ROCm
Evaluar programas de GPU usando benchmarks y métricas
Aprender las mejores prácticas y consejos para la programación de GPU
Explorar las tendencias actuales y futuras, así como los desafíos de la programación de GPU

Resumen y Próximos Pasos

Requerimientos

Comprensión del lenguaje C/C++ y los conceptos de programación paralela
Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria
Experiencia con herramientas de línea de comandos y editores de código

Audiencia

Desarrolladores que deseen aprender a usar diferentes marcos para la programación de GPU y comparar sus características, rendimiento y compatibilidad
Desarrolladores que deseen escribir código portable y escalable que pueda ejecutarse en diferentes plataformas y dispositivos
Programadores que deseen explorar los compromisos y desafíos de la programación y optimización de GPU

28 Horas

¿Necesita ayuda para elegir el curso adecuado?

Programación de GPU - OpenCL vs CUDA vs ROCm

Temario del curso

Requerimientos

Próximos cursos

Programación de GPU - OpenCL vs CUDA vs ROCm

Programación de GPU - OpenCL vs CUDA vs ROCm

Programación de GPU - OpenCL vs CUDA vs ROCm

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Programación de GPU - OpenCL vs CUDA vs ROCm

Temario del curso

Requerimientos

Próximos cursos

Programación de GPU - OpenCL vs CUDA vs ROCm

Programación de GPU - OpenCL vs CUDA vs ROCm

Programación de GPU - OpenCL vs CUDA vs ROCm

Cursos Relacionados

Desarrollando Aplicaciones de IA con Huawei Ascend y CANN

Deployando Modelos de IA con CANN y Procesadores Ascend AI

GPU Programming en Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Introducción a CANN para Desarrolladores de Frameworks de IA

CANN para Edge AI Implementación

Comprensión de la Pila de Cómputo AI de Huawei: Desde CANN hasta MindSpore

Optimización del Desempeño de Redes Neuronales con CANN SDK

CANN SDK para Computer Vision y Pipes de NLP

Construcción de Operadores Personalizados de IA con CANN TIK y TVM

Migrando Aplicaciones CUDA a Arquitecturas Chinas GPU

Performance Optimization on Ascend, Biren, and Cambricon

Categorías Relacionadas

GPU

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites