Integraciones LLM

LLM Integrations

Agnostico de LLM por Diseno

Hyperdrome no esta atado a un solo proveedor de IA. La arquitectura del agente separa el analisis de intencion, la recopilacion de contexto y la ejecucion en capas independientes — por lo que el backend LLM puede intercambiarse sin cambiar nada mas. Esto significa que Hyperdrome funciona con cualquier modelo de lenguaje grande hoy, y funcionara con cualquier modelo lanzado manana.

Modelos Soportados

/images/brands/anthropic.svg

Claude

Opus, Sonnet, Haiku — En vivo
/images/brands/openai.svg

GPT-4

GPT-4o, GPT-4, GPT-4 Turbo — En vivo
/images/brands/gemini.svg

Gemini

Gemini 2.5 Pro, 2.5 Flash — En vivo
/images/brands/meta.svg

Codigo Abierto

Llama, Mistral, Qwen, DeepSeek — Planificado
Todos los modelos estan disponibles a $0 de costo para los usuarios. Hyperdrome cubre los costos de inferencia.

Arquitectura

El pipeline del agente es agnostico de modelo en cada etapa:
User Input (natural language or /command)


┌──────────────────┐
│  Intent Parser   │ ← Any LLM (Claude, GPT-4, Gemini, Llama...)
│  "What does the  │
│   user want?"    │
└────────┬─────────┘


┌──────────────────┐
│ Context Gatherer │ ← On-chain + off-chain data (no LLM needed)
│  Wallet, pools,  │
│  prices, APRs    │
└────────┬─────────┘


┌──────────────────┐
│    Responder     │ ← Any LLM (generates explanation + UI cards)
└────────┬─────────┘


┌──────────────────┐
│    Executor      │ ← Transaction builder (no LLM needed)
│  Build tx, sign, │
│  submit on-chain │
└──────────────────┘
El LLM solo interviene en dos pasos: entender que quiere el usuario y explicar el resultado. Todo lo demas — leer el estado de la blockchain, construir transacciones, enviarlas on-chain — es codigo deterministico.

Enrutamiento Inteligente

El backend selecciona automaticamente el mejor modelo para cada solicitud basandose en:
FactorLogic
ComplexityConsultas simples (verificacion de precios, saldo) → modelo mas rapido. Acciones complejas multi-paso → modelo mas capaz.
LanguageAlgunos modelos funcionan mejor en idiomas especificos. El enrutador optimiza para el idioma detectado del usuario.
LatencySi el modelo principal es lento o no esta disponible, el enrutador cambia a la siguiente mejor opcion en < 500ms.
CostEl enrutador equilibra capacidad vs. costo para mantener la inferencia gratuita para todos los usuarios.

Bring Your Own LLM (Proximamente)

Esta funcionalidad esta en la hoja de ruta y aun no esta disponible.
Los usuarios podran conectar su propio proveedor LLM:
  • API key — Conecta tu propia clave API de OpenAI, Anthropic, Google, o cualquier API compatible con OpenAI
  • Modelos auto-hospedados — Apunta el agente a tu propio endpoint de Ollama, vLLM o TGI ejecutando Llama, Mistral, Qwen o cualquier modelo open-source
  • System prompts personalizados — Personaliza la personalidad del agente, tolerancia al riesgo y estilo de respuesta
  • Privacidad total — Al usar tu propio modelo, ningun dato pasa por los servidores de inferencia de Hyperdrome

Endpoints Compatibles

Cualquier endpoint que implemente el formato de API OpenAI Chat Completions funcionara:
RuntimeExample Models
OllamaLlama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma
vLLMAny HuggingFace model
TGIAny HuggingFace model
Together AILlama, Mixtral, Qwen
GroqLlama, Mixtral, Gemma
FireworksLlama, Mixtral, DeepSeek

Por Que Importa Ser Agnostico de LLM

  1. Sin dependencia de proveedor — Si un proveedor sube precios, degrada la calidad o agrega restricciones, Hyperdrome cambia sin problemas.
  2. El mejor modelo para el trabajo — Diferentes modelos sobresalen en diferentes tareas. El enrutamiento permite a Hyperdrome usar la mejor herramienta para cada solicitud.
  3. A prueba de futuro — Se lanzan nuevos modelos mensualmente. La arquitectura agnostica de LLM permite que Hyperdrome los adopte inmediatamente sin reescrituras.
  4. Soberania del usuario — Con Bring Your Own LLM, los usuarios controlan sus datos e inferencia. Sin dependencia de proveedores de IA centralizados.
  5. Resistencia a la censura — Los modelos open-source no pueden ser apagados ni restringidos. Los usuarios que ejecutan su propia instancia de Llama o Mistral tienen autonomia total.