Integraciones LLM

Agnostico de LLM por Diseno
Hyperdrome no esta atado a un solo proveedor de IA. La arquitectura del agente separa el analisis de intencion, la recopilacion de contexto y la ejecucion en capas independientes — por lo que el backend LLM puede intercambiarse sin cambiar nada mas. Esto significa que Hyperdrome funciona con cualquier modelo de lenguaje grande hoy, y funcionara con cualquier modelo lanzado manana.Modelos Soportados
Claude
Opus, Sonnet, Haiku — En vivo
GPT-4
GPT-4o, GPT-4, GPT-4 Turbo — En vivo
Gemini
Gemini 2.5 Pro, 2.5 Flash — En vivo
Codigo Abierto
Llama, Mistral, Qwen, DeepSeek — Planificado
Arquitectura
El pipeline del agente es agnostico de modelo en cada etapa:Enrutamiento Inteligente
El backend selecciona automaticamente el mejor modelo para cada solicitud basandose en:| Factor | Logic |
|---|---|
| Complexity | Consultas simples (verificacion de precios, saldo) → modelo mas rapido. Acciones complejas multi-paso → modelo mas capaz. |
| Language | Algunos modelos funcionan mejor en idiomas especificos. El enrutador optimiza para el idioma detectado del usuario. |
| Latency | Si el modelo principal es lento o no esta disponible, el enrutador cambia a la siguiente mejor opcion en < 500ms. |
| Cost | El enrutador equilibra capacidad vs. costo para mantener la inferencia gratuita para todos los usuarios. |
Bring Your Own LLM (Proximamente)
Los usuarios podran conectar su propio proveedor LLM:- API key — Conecta tu propia clave API de OpenAI, Anthropic, Google, o cualquier API compatible con OpenAI
- Modelos auto-hospedados — Apunta el agente a tu propio endpoint de Ollama, vLLM o TGI ejecutando Llama, Mistral, Qwen o cualquier modelo open-source
- System prompts personalizados — Personaliza la personalidad del agente, tolerancia al riesgo y estilo de respuesta
- Privacidad total — Al usar tu propio modelo, ningun dato pasa por los servidores de inferencia de Hyperdrome
Endpoints Compatibles
Cualquier endpoint que implemente el formato de API OpenAI Chat Completions funcionara:| Runtime | Example Models |
|---|---|
| Ollama | Llama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma |
| vLLM | Any HuggingFace model |
| TGI | Any HuggingFace model |
| Together AI | Llama, Mixtral, Qwen |
| Groq | Llama, Mixtral, Gemma |
| Fireworks | Llama, Mixtral, DeepSeek |
Por Que Importa Ser Agnostico de LLM
- Sin dependencia de proveedor — Si un proveedor sube precios, degrada la calidad o agrega restricciones, Hyperdrome cambia sin problemas.
- El mejor modelo para el trabajo — Diferentes modelos sobresalen en diferentes tareas. El enrutamiento permite a Hyperdrome usar la mejor herramienta para cada solicitud.
- A prueba de futuro — Se lanzan nuevos modelos mensualmente. La arquitectura agnostica de LLM permite que Hyperdrome los adopte inmediatamente sin reescrituras.
- Soberania del usuario — Con Bring Your Own LLM, los usuarios controlan sus datos e inferencia. Sin dependencia de proveedores de IA centralizados.
- Resistencia a la censura — Los modelos open-source no pueden ser apagados ni restringidos. Los usuarios que ejecutan su propia instancia de Llama o Mistral tienen autonomia total.