KI-Agent mit jedem Modell: Nutzen Sie ChatGPT, Claude oder Ihr eigenes

Das Problem, an ein einziges Modell gebunden zu sein

Wenn die meisten Menschen nach einer „selbst gehosteten ChatGPT-Alternative“ suchen, vermischen sie zwei Dinge in derselben Frage: wo das Modell läuft und was das Modell tatsächlich für sie tun kann.

Open WebUI, LibreChat und AnythingLLM lösen den ersten Teil. Es handelt sich um Chat-Frontends, die einem Modell vorgeschaltet sind und Ihnen eine ChatGPT-ähnliche Oberfläche bieten, die Sie selbst hosten. Sie sind hervorragend in dem, was sie tun.

Aber sie alle teilen dieselbe grundlegende Einschränkung: Sie warten darauf, dass Sie etwas eintippen.

Die Frage, die niemand stellt, die aber letztlich jeder beantwortet haben möchte, lautet: „Kann ich einen Assistenten haben, der ChatGPT, Claude, Gemini oder ein lokales Llama nutzt und tatsächlich eigenständig Arbeit erledigt?“

Ja. Genau das tut Hermes Agent.

Mehrere KI-Modellknoten, die in einen einzigen grünen Agenten-Hub einspeisen und sich nach außen mit Symbolen für E-Mail, Telegram, Kalender und Datenbank verbinden

Modellunabhängig: der eigentliche Vorteil

Hermes Agent ist es egal, welches Modell Sie verwenden. Seine Aufgabe ist es, ein dauerhafter Agent mit Gedächtnis, Tool-Aufrufen und geplanter Ausführung zu sein. Das KI-Modell ist austauschbar: Stellen Sie es sich als das „Gehirn“ vor, das Sie wählen, während Hermes der Körper ist, der sich erinnert, handelt und nach einem Zeitplan läuft.

In der Praxis können Sie Hermes verbinden mit:

ChatGPT (GPT-4o / GPT-4.1) über Ihren eigenen OpenAI-Schlüssel
Claude (Sonnet oder Opus) über Ihren Anthropic-Schlüssel
Gemini über die API von Google
Jedes lokale Modell (Llama, Mistral, Qwen) über Ollama oder einen beliebigen OpenAI-kompatiblen Endpunkt
OpenRouter, um mit einem einzigen Schlüssel über Dutzende von Anbietern zu routen

Sie können sogar Modelle wechseln, ohne sonst etwas zu ändern. Wenn Sie heute GPT-4o als Standardgehirn nutzen und morgen zu Claude wechseln möchten, ändern Sie eine einzige Einstellung. Das Gedächtnis, die Tool-Verbindungen, die geplanten Skills: All das wird übernommen.

Das ist wichtiger, als es klingt. KI-Modelle verbessern sich schnell. Die Möglichkeit, das Gehirn auszutauschen, ohne den Agenten neu aufzubauen, ist kein nettes Extra. Es ist die Art und Weise, wie Sie eine Bindung vermeiden, wenn in sechs Monaten ein besseres Modell erscheint.

Was Hermes zu jedem Modell hinzufügt

Eine Chat-Oberfläche sendet Ihre Nachricht an ein Modell und zeigt Ihnen die Antwort. Das ist der gesamte Funktionsumfang.

Hermes fügt drei Ebenen hinzu, die kein Chat-Frontend bietet:

1. Dauerhaftes Gedächtnis über Sitzungen hinweg. Hermes erinnert sich daran, worüber Sie letzten Dienstag gesprochen haben. Es kann diesen Kontext im heutigen Gespräch nutzen, ohne dass Sie ihn erneut einfügen müssen.

2. Tool-Aufrufe aus eigener Initiative. Hermes kann Ihren E-Mail-Posteingang lesen, eine Datenbank abfragen, in Telegram posten, Stripe prüfen oder eine beliebige API aufrufen, ohne dass Sie darum bitten, nach einem von Ihnen festgelegten Zeitplan.

3. Geplante Ausführung. Ihr Agent läuft um 7 Uhr morgens und sendet Ihnen eine Zusammenfassung. Er läuft, nachdem ein Stripe-Ereignis ausgelöst wurde, und benachrichtigt Sie. Er prüft stündlich ein Dashboard und meldet sich nur, wenn sich etwas ändert. Nichts davon erfordert, dass Sie ein Chat-Fenster öffnen.

Das Modell, das Sie einbinden, übernimmt das Schlussfolgern und die Sprache. Hermes übernimmt alles andere.

Ein Einstellungsbereich, der einen Modellauswähler mit drei Optionen und einem grünen Häkchen am ausgewählten Modell zeigt, umgeben von einer abstrakten dunklen Chat-Oberfläche mit warmem Lampenlicht

Die drei Möglichkeiten, Hermes mit dem Modell Ihrer Wahl zu betreiben

Hermify bietet drei Tarife, die um die Idee der Modellunabhängigkeit herum aufgebaut sind:

Starter (BYOK) — $19/Monat. Bringen Sie Ihren eigenen API-Schlüssel mit: OpenAI, Anthropic, OpenRouter oder einen beliebigen kompatiblen Endpunkt. Sie bezahlen Ihren Modellanbieter direkt. Hermify kümmert sich um die Agenten-Infrastruktur, den Gedächtnisspeicher, den VPS und die Verfügbarkeit. Gut, wenn Sie bereits ein bevorzugtes Modell haben und Ihre eigene Abrechnung behalten möchten.

Pro — $29/Monat. Hermify stellt den verwalteten API-Schlüssel bereit. Sie erhalten Zugang zu aktuellen Spitzenmodellen, ohne ein separates API-Konto zu benötigen. Einfachere Abrechnung, keinerlei Verwaltung von API-Schlüsseln, Modell-Upgrades werden für Sie erledigt.

Dedicated — $49/Monat. Ein dedizierter VPS, eine isolierte Umgebung und volle Kontrolle über das Modell-Routing. Für Teams, die Datenisolierung benötigen oder private lokale Modelle neben Cloud-APIs betreiben möchten.

Alle drei Tarife geben Ihnen denselben Agenten: dauerhaftes Gedächtnis, Tool-Aufrufe, geplante Skills, Unterstützung für MCP-Server. Der einzige Unterschied besteht darin, wer den Modellschlüssel und die Hardware verwaltet.

So behalten Sie Ihre Chat-Oberfläche, wenn Sie eine möchten

Hermes spricht eingehend die OpenAI-kompatible API. Das bedeutet: Wenn Sie bereits Open WebUI bereitgestellt haben, können Sie es auf Ihre Hermes-Instanz richten und über dieselbe Oberfläche chatten, die Sie bereits nutzen.

Sie erhalten das Beste aus beiden Welten: das vertraute Chat-Fenster, wenn Sie tippen möchten, und einen Agenten, der im Hintergrund läuft, wenn Sie es nicht möchten.

Der Unterschied besteht darin, dass das Modell nun nicht an einen einzigen Anbieter gebunden ist, der Agent sich daran erinnert, was Sie letzte Woche gesagt haben, und Dinge erledigen kann, ohne darum gebeten zu werden.

Was Sie als Nächstes tun sollten

Wenn Sie zunächst mit einem lokalen Modell experimentieren möchten, installieren Sie Ollama und richten Sie Hermes darauf aus. Sie können später zu einem Cloud-Modell wechseln, ohne sonst etwas anzufassen.

Wenn Sie die Infrastruktur überspringen und direkt zum Agenten gelangen möchten: Hermify ist in weniger als fünf Minuten eingerichtet.

Das Modell ist Ihre Wahl. Der Agent ist Hermes.