LLM-Integrationen

LLM Integrations

LLM-agnostisch von Grund auf

Hyperdrome ist nicht an einen einzelnen KI-Anbieter gebunden. Die Agent-Architektur trennt Absichtserkennung, Kontextsammlung und Ausfuehrung in unabhaengige Schichten — so kann das LLM-Backend ausgetauscht werden, ohne etwas anderes zu aendern. Das bedeutet, Hyperdrome funktioniert mit jedem grossen Sprachmodell heute und wird mit jedem Modell funktionieren, das morgen veroeffentlicht wird.

Unterstuetzte Modelle

/images/brands/anthropic.svg

Claude

Opus, Sonnet, Haiku — Live
/images/brands/openai.svg

GPT-4

GPT-4o, GPT-4, GPT-4 Turbo — Live
/images/brands/gemini.svg

Gemini

Gemini 2.5 Pro, 2.5 Flash — Live
/images/brands/meta.svg

Open Source

Llama, Mistral, Qwen, DeepSeek — Geplant
Alle Modelle sind fuer Nutzer kostenlos verfuegbar. Hyperdrome uebernimmt die Inferenzkosten.

Architektur

Die Agent-Pipeline ist in jeder Phase modell-agnostisch:
User Input (natural language or /command)


┌──────────────────┐
│  Intent Parser   │ ← Any LLM (Claude, GPT-4, Gemini, Llama...)
│  "What does the  │
│   user want?"    │
└────────┬─────────┘


┌──────────────────┐
│ Context Gatherer │ ← On-chain + off-chain data (no LLM needed)
│  Wallet, pools,  │
│  prices, APRs    │
└────────┬─────────┘


┌──────────────────┐
│    Responder     │ ← Any LLM (generates explanation + UI cards)
└────────┬─────────┘


┌──────────────────┐
│    Executor      │ ← Transaction builder (no LLM needed)
│  Build tx, sign, │
│  submit on-chain │
└──────────────────┘
Das LLM ist nur an zwei Schritten beteiligt: Verstehen, was der Nutzer will, und Erklaerung des Ergebnisses. Alles andere — Blockchain-Zustand lesen, Transaktionen bauen, On-Chain einreichen — ist deterministischer Code.

Intelligentes Routing

Das Backend waehlt automatisch das beste Modell fuer jede Anfrage basierend auf:
FaktorLogik
KomplexitaetEinfache Abfragen (Preisueberpruefungen, Guthaben) → schnellstes Modell. Komplexe Mehrstufenaktionen → leistungsfaehigstes Modell.
SpracheEinige Modelle performen besser in bestimmten Sprachen. Der Router optimiert fuer die erkannte Sprache des Nutzers.
LatenzWenn das primaere Modell langsam oder nicht verfuegbar ist, faellt der Router in < 500ms auf die naechstbeste Option zurueck.
KostenDer Router balanciert Leistung vs. Kosten, um Inferenz fuer alle Nutzer kostenlos zu halten.

Bring Your Own LLM (Bald verfuegbar)

Diese Funktion steht auf der Roadmap und ist noch nicht verfuegbar.
Nutzer werden in der Lage sein, ihren eigenen LLM-Anbieter zu verbinden:
  • API Key — Eigenen OpenAI-, Anthropic-, Google- oder einen beliebigen OpenAI-kompatiblen API-Schluessel einbinden
  • Selbst gehostete Modelle — Den Agenten auf den eigenen Ollama-, vLLM- oder TGI-Endpunkt richten, der Llama, Mistral, Qwen oder ein anderes Open-Source-Modell ausfuehrt
  • Benutzerdefinierte System-Prompts — Persoenlichkeit, Risikotoleranz und Antwortstil des Agenten anpassen
  • Volle Privatsphaere — Bei Verwendung des eigenen Modells werden keine Daten ueber die Inferenz-Server von Hyperdrome geleitet

Kompatible Endpunkte

Jeder Endpunkt, der das OpenAI Chat Completions API-Format implementiert, funktioniert:
RuntimeExample Models
OllamaLlama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma
vLLMAny HuggingFace model
TGIAny HuggingFace model
Together AILlama, Mixtral, Qwen
GroqLlama, Mixtral, Gemma
FireworksLlama, Mixtral, DeepSeek

Warum LLM-agnostisch wichtig ist

  1. Kein Vendor-Lock-in — Wenn ein Anbieter Preise erhoeht, Qualitaet verschlechtert oder Einschraenkungen hinzufuegt, wechselt Hyperdrome nahtlos.
  2. Bestes Modell fuer den Job — Verschiedene Modelle glaenzen bei verschiedenen Aufgaben. Routing laesst Hyperdrome das beste Werkzeug fuer jede Anfrage nutzen.
  3. Zukunftssicher — Neue Modelle werden monatlich veroeffentlicht. LLM-agnostische Architektur bedeutet, dass Hyperdrome sie sofort ohne Umschreibungen uebernimmt.
  4. Nutzersouveraenitaet — Mit Bring Your Own LLM kontrollieren Nutzer ihre Daten und Inferenz. Keine Abhaengigkeit von zentralisierten KI-Anbietern.
  5. Zensurresistenz — Open-Source-Modelle koennen nicht abgeschaltet oder eingeschraenkt werden. Nutzer, die ihre eigene Llama- oder Mistral-Instanz betreiben, haben volle Autonomie.