Integrations LLM

LLM-Agnostique par conception
Hyperdrome n’est pas verrouille sur un seul fournisseur d’IA. L’architecture de l’agent separe l’analyse d’intention, la collecte de contexte et l’execution en couches independantes — le backend LLM peut donc etre echange sans rien modifier d’autre. Cela signifie qu’Hyperdrome fonctionne avec n’importe quel modele de langage aujourd’hui, et fonctionnera avec n’importe quel modele publie demain.Modeles supportes
Claude
Opus, Sonnet, Haiku — En ligne
GPT-4
GPT-4o, GPT-4, GPT-4 Turbo — En ligne
Gemini
Gemini 2.5 Pro, 2.5 Flash — En ligne
Open Source
Llama, Mistral, Qwen, DeepSeek — Prevu
Architecture
Le pipeline de l’agent est agnostique au modele a chaque etape :Routage Intelligent
Le backend selectionne automatiquement le meilleur modele pour chaque requete en fonction de :| Factor | Logic |
|---|---|
| Complexity | Simple queries (price checks, balance) → fastest model. Complex multi-step actions → most capable model. |
| Language | Some models perform better in specific languages. The router optimizes for the user’s detected language. |
| Latency | If the primary model is slow or unavailable, the router falls back to the next best option in < 500ms. |
| Cost | The router balances capability vs. cost to keep inference free for all users. |
Bring Your Own LLM (Bientot disponible)
Les utilisateurs pourront connecter leur propre fournisseur LLM :- API key — Branchez votre propre cle API OpenAI, Anthropic, Google, ou toute cle compatible OpenAI
- Modeles auto-heberges — Pointez l’agent vers votre propre endpoint Ollama, vLLM ou TGI executant Llama, Mistral, Qwen ou tout modele open-source
- System prompts personnalises — Personnalisez la personnalite de l’agent, la tolerance au risque et le style de reponse
- Confidentialite totale — Lorsque vous utilisez votre propre modele, aucune donnee ne passe par les serveurs d’inference d’Hyperdrome
Endpoints compatibles
Tout endpoint implementant le format OpenAI Chat Completions API fonctionnera :| Runtime | Example Models |
|---|---|
| Ollama | Llama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma |
| vLLM | Any HuggingFace model |
| TGI | Any HuggingFace model |
| Together AI | Llama, Mixtral, Qwen |
| Groq | Llama, Mixtral, Gemma |
| Fireworks | Llama, Mixtral, DeepSeek |
Pourquoi le LLM-Agnostique est important
- Pas de verrouillage fournisseur — Si un fournisseur augmente ses prix, degrade la qualite ou ajoute des restrictions, Hyperdrome bascule en toute transparence.
- Le meilleur modele pour la tache — Differents modeles excellent dans differentes taches. Le routage permet a Hyperdrome d’utiliser le meilleur outil pour chaque requete.
- A l’epreuve du futur — De nouveaux modeles sortent chaque mois. L’architecture LLM-agnostique signifie qu’Hyperdrome les adopte immediatement sans reecriture.
- Souverainete de l’utilisateur — Avec Bring Your Own LLM, les utilisateurs controlent leurs donnees et leur inference. Aucune dependance envers des fournisseurs d’IA centralises.
- Resistance a la censure — Les modeles open-source ne peuvent pas etre arretes ou restreints. Les utilisateurs executant leur propre instance Llama ou Mistral ont une autonomie totale.