LLM 統合

設計からLLM非依存
Hyperdromeは単一のAIプロバイダーに縛られていません。エージェントアーキテクチャは意図解析、コンテキスト収集、実行を独立したレイヤーに分離しています — そのためLLMバックエンドは他を変更せずに交換できます。 これは、Hyperdromeが今日のあらゆる大規模言語モデルで動作し、明日リリースされるあらゆるモデルでも動作することを意味します。サポートモデル
Claude
Opus, Sonnet, Haiku — 稼働中
GPT-4
GPT-4o, GPT-4, GPT-4 Turbo — 稼働中
Gemini
Gemini 2.5 Pro, 2.5 Flash — 稼働中
オープンソース
Llama, Mistral, Qwen, DeepSeek — 予定
アーキテクチャ
エージェントパイプラインはすべてのステージでモデル非依存です:インテリジェントルーティング
バックエンドは以下の要素に基づいて各リクエストに最適なモデルを自動選択します:| 要素 | ロジック |
|---|---|
| 複雑さ | シンプルなクエリ(価格確認、残高)→ 最速モデル。複雑なマルチステップアクション → 最高性能モデル。 |
| 言語 | 一部のモデルは特定の言語でより優れたパフォーマンスを発揮。ルーターはユーザーの検出された言語に最適化。 |
| レイテンシ | プライマリモデルが遅いか利用不可の場合、ルーターは500ms以内に次善のオプションにフォールバック。 |
| コスト | ルーターはすべてのユーザーに推論を無料で維持するため、性能とコストのバランスを取る。 |
Bring Your Own LLM (近日公開)
ユーザーが自身のLLMプロバイダーを接続できるようになります:- API Key — 自身のOpenAI、Anthropic、Google、またはOpenAI互換APIキーを接続
- セルフホストモデル — Llama、Mistral、Qwen、その他のオープンソースモデルを実行する自身のOllama、vLLM、またはTGIエンドポイントにエージェントを接続
- カスタムシステムプロンプト — エージェントの性格、リスク許容度、レスポンススタイルをカスタマイズ
- 完全なプライバシー — 自身のモデル使用時、データはHyperdromeの推論サーバーを通過しない
互換エンドポイント
OpenAI Chat Completions API形式を実装するすべてのエンドポイントが動作します:| Runtime | Example Models |
|---|---|
| Ollama | Llama 3.3, Mistral, Qwen 2.5, DeepSeek V3, Gemma |
| vLLM | Any HuggingFace model |
| TGI | Any HuggingFace model |
| Together AI | Llama, Mixtral, Qwen |
| Groq | Llama, Mixtral, Gemma |
| Fireworks | Llama, Mixtral, DeepSeek |
LLM非依存が重要な理由
- ベンダーロックインなし — プロバイダーが価格を上げたり、品質を低下させたり、制限を追加しても、Hyperdromeはシームレスに切り替えます。
- 最適なモデルを適材適所で — モデルごとに得意な分野が異なります。ルーティングにより、Hyperdromeは各リクエストに最適なツールを使用できます。
- 将来への対応 — 新しいモデルは毎月リリースされます。LLM非依存アーキテクチャにより、Hyperdromeは書き換えなしに即座に導入できます。
- ユーザー主権 — Bring Your Own LLMにより、ユーザーがデータと推論を制御。中央集権的なAIプロバイダーへの依存なし。
- 検閲耐性 — オープンソースモデルは停止や制限ができません。自身のLlamaやMistralインスタンスを運用するユーザーは完全な自律性を持ちます。