Integrations LLM

LLM Integrations

LLM-Agnostique par conception

Hyperdrome n’est pas verrouille sur un seul fournisseur d’IA. L’architecture de l’agent separe l’analyse d’intention, la collecte de contexte et l’execution en couches independantes — le backend LLM peut donc etre echange sans rien modifier d’autre. Cela signifie qu’Hyperdrome fonctionne avec n’importe quel modele de langage aujourd’hui, et fonctionnera avec n’importe quel modele publie demain.

Modeles supportes

/images/brands/anthropic.svg

Claude

Opus, Sonnet, Haiku — En ligne
/images/brands/openai.svg

GPT-4

GPT-4o, GPT-4, GPT-4 Turbo — En ligne
/images/brands/gemini.svg

Gemini

Gemini 2.5 Pro, 2.5 Flash — En ligne
/images/brands/meta.svg

Open Source

Llama, Mistral, Qwen, DeepSeek — Prevu
Tous les modeles sont disponibles a 0 $ de cout pour les utilisateurs. Hyperdrome couvre les couts d’inference.

Architecture

Le pipeline de l’agent est agnostique au modele a chaque etape :
User Input (natural language or /command)


┌──────────────────┐
│  Intent Parser   │ ← Any LLM (Claude, GPT-4, Gemini, Llama...)
│  "What does the  │
│   user want?"    │
└────────┬─────────┘


┌──────────────────┐
│ Context Gatherer │ ← On-chain + off-chain data (no LLM needed)
│  Wallet, pools,  │
│  prices, APRs    │
└────────┬─────────┘


┌──────────────────┐
│    Responder     │ ← Any LLM (generates explanation + UI cards)
└────────┬─────────┘


┌──────────────────┐
│    Executor      │ ← Transaction builder (no LLM needed)
│  Build tx, sign, │
│  submit on-chain │
└──────────────────┘
Le LLM n’intervient que dans deux etapes : comprendre ce que l’utilisateur veut, et expliquer le resultat. Tout le reste — lire l’etat de la blockchain, construire les transactions, soumettre on-chain — est du code deterministe.

Routage Intelligent

Le backend selectionne automatiquement le meilleur modele pour chaque requete en fonction de :
FactorLogic
ComplexitySimple queries (price checks, balance) → fastest model. Complex multi-step actions → most capable model.
LanguageSome models perform better in specific languages. The router optimizes for the user’s detected language.
LatencyIf the primary model is slow or unavailable, the router falls back to the next best option in < 500ms.
CostThe router balances capability vs. cost to keep inference free for all users.

Bring Your Own LLM (Bientot disponible)

Cette fonctionnalite est sur la feuille de route et n’est pas encore disponible.
Les utilisateurs pourront connecter leur propre fournisseur LLM :
  • API key — Branchez votre propre cle API OpenAI, Anthropic, Google, ou toute cle compatible OpenAI
  • Modeles auto-heberges — Pointez l’agent vers votre propre endpoint Ollama, vLLM ou TGI executant Llama, Mistral, Qwen ou tout modele open-source
  • System prompts personnalises — Personnalisez la personnalite de l’agent, la tolerance au risque et le style de reponse
  • Confidentialite totale — Lorsque vous utilisez votre propre modele, aucune donnee ne passe par les serveurs d’inference d’Hyperdrome

Endpoints compatibles

Tout endpoint implementant le format OpenAI Chat Completions API fonctionnera :
RuntimeExample Models
OllamaLlama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma
vLLMAny HuggingFace model
TGIAny HuggingFace model
Together AILlama, Mixtral, Qwen
GroqLlama, Mixtral, Gemma
FireworksLlama, Mixtral, DeepSeek

Pourquoi le LLM-Agnostique est important

  1. Pas de verrouillage fournisseur — Si un fournisseur augmente ses prix, degrade la qualite ou ajoute des restrictions, Hyperdrome bascule en toute transparence.
  2. Le meilleur modele pour la tache — Differents modeles excellent dans differentes taches. Le routage permet a Hyperdrome d’utiliser le meilleur outil pour chaque requete.
  3. A l’epreuve du futur — De nouveaux modeles sortent chaque mois. L’architecture LLM-agnostique signifie qu’Hyperdrome les adopte immediatement sans reecriture.
  4. Souverainete de l’utilisateur — Avec Bring Your Own LLM, les utilisateurs controlent leurs donnees et leur inference. Aucune dependance envers des fournisseurs d’IA centralises.
  5. Resistance a la censure — Les modeles open-source ne peuvent pas etre arretes ou restreints. Les utilisateurs executant leur propre instance Llama ou Mistral ont une autonomie totale.