Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama es una herramienta de código abierto para ejecutar modelos de lenguaje grande localmente en hardware de consumo y empresarial. Abstrae la cuantificación de modelos, la asignación de GPU y el servicio de API en una sola interfaz de línea de comandos, permitiendo a las organizaciones autoalojar LLMs como Llama, Mistral y Qwen sin enviar indicaciones (prompts) ni datos a OpenAI, Anthropic o Google.

Esta formación en vivo dirigida por un instructor (en línea o presencial) está dirigida a ingenieros de IA y operadores de plataforma de nivel intermedio que desean utilizar Ollama para reemplazar las APIs de LLM en la nube con inferencia de modelos de lenguaje autoalojada y soberana.

Al final de esta formación, los participantes podrán:

Instalar Ollama en Linux, macOS y Windows con soporte de GPU.
Descargar, cuantificar y servir modelos desde el registro de Ollama y HuggingFace.
Construir Modelfiles personalizados con indicaciones del sistema y ajuste de parámetros.
Integrar LLMs locales con aplicaciones a través de la API compatible con OpenAI.
Optimizar el rendimiento de la inferencia para configuraciones solo de CPU y multi-GPU.

Formato del Curso

Conferencia interactiva y discusión.
Numerosos ejercicios y práctica.
Implementación práctica en un entorno de laboratorio en vivo.

Opciones de Personalización del Curso

Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinarlo.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Soberanía de IA y Despliegue Local de LLM

Riesgos de los LLM en la nube: retención de datos, entrenamiento con entradas, jurisdicción extranjera.
Arquitectura de Ollama: servidor de modelos, registro y API compatible con OpenAI.
Comparación con vLLM, llama.cpp y Text Generation Inference.
Licenciamiento de modelos: términos de Llama, Mistral, Qwen y Gemma.

Instalación y Configuración de Hardware

Instalación de Ollama en Linux con soporte CUDA y ROCm.
Alternativa solo de CPU y optimización AVX/AVX2.
Despliegue en Docker y mapeo de volúmenes persistentes.
Configuración multi-GPU y estrategias de asignación de VRAM.

Gestión de Modelos

Descarga de modelos desde el registro de Ollama: ollama pull llama3.
Importación de modelos GGUF desde HuggingFace y TheBloke.
Niveles de cuantificación: compensaciones entre Q4_K_M, Q5_K_M y Q8_0.
Cambio de modelos y límites de carga concurrente de modelos.

Modelfiles Personalizados

Escritura de sintaxis Modelfile: FROM, PARAMETER, SYSTEM, TEMPLATE.
Ajuste de temperatura, top_p y repeat_penalty.
Ingeniería de indicaciones del sistema para comportamiento específico por rol.
Creación y publicación de modelos personalizados en el registro local.

Integración de API

Endpoint /v1/chat/completions compatible con OpenAI.
Respuestas en streaming y modo JSON.
Integración con LangChain, LlamaIndex y aplicaciones personalizadas.
Autenticación y limitación de velocidad con proxy inverso.

Optimización del Rendimiento

Tamaño de la ventana de contexto y gestión del caché KV.
Inferencia por lotes y manejo de solicitudes paralelas.
Asignación de hilos de CPU y conocimiento de NUMA.
Monitoreo de utilización de GPU y presión de memoria.

Seguridad y Cumplimiento

Aislamiento de red para puntos finales de servicio de modelos.
Filtrado de entradas y pipelines de moderación de salidas.
Registro de auditoría de indicaciones (prompts) y completados.
Proveniencia de modelos y verificación de hashes.

Requerimientos

Administración intermedia de Linux y contenedores.
Comprensión de modelos de aprendizaje automático y transformadores a alto nivel.
Familiaridad con APIs REST y JSON.

Público Objetivo

Ingenieros y desarrolladores de IA que reemplazan APIs de LLM en la nube.
Organizaciones con sensibilidad de datos que impide el uso de modelos en la nube.
Equipos gubernamentales y de defensa que requieren modelos de lenguaje desconectados de internet (air-gapped).

14 Horas

Formación Corporativa a Medida

Soluciones de formación diseñadas exclusivamente para empresas.

Contenido personalizado: Adaptamos el temario y los ejercicios prácticos a los objetivos y necesidades reales del proyecto.
Calendario flexible: Fechas y horarios adaptados a la agenda de su equipo.
Modalidad: Online (en directo), In-company (en sus oficinas) o Híbrida.

Inversión

Precio por grupo privado (formación online) desde 2900 € + IVA*

Contáctenos para obtener un presupuesto exacto y conocer nuestras promociones actuales

(*El precio final puede variar según la especialización técnica del curso, el nivel de personalización, la modalidad y el número de participantes)

¿Necesita ayuda para elegir el curso adecuado?

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Temario del curso

Requerimientos

Formación Corporativa a Medida

Próximos cursos

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Temario del curso

Requerimientos

Formación Corporativa a Medida

Próximos cursos

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Ollama: Modelos de Lenguaje Grande Autoalojados que Reemplazan las APIs de OpenAI y Claude

Cursos Relacionados

Depuración y Evaluación Avanzada de Modelos Ollama

Construyendo Flujos de Trabajo Privados de IA con Ollama

Implementación y Optimización de Modelos de Lenguaje Grande (LLMs) con Ollama

Ajuste fino y personalización de modelos de IA en Ollama

Aplicaciones Multimodales con Ollama

Empezando con Ollama: Ejecución de Modelos de IA Locales

Ollama y Privacidad de Datos: Patrones de Implementación Segura

Aplicaciones de Ollama en Finanzas

Aplicaciones de Ollama en el sector salud

Ollama para IA Responsable y Gobernanza

Escalado de Ollama y Optimización de la Infraestructura

Dominio de la Ingeniería de Prompts con Ollama

Categorías Relacionadas

Ollama

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites