Hermes Agent vs. AutoGen: Einzelagent oder Multi-Agent?

Zwei Frameworks, zwei unterschiedliche Probleme

Wenn Sie nach „hermes agent vs autogen" gesucht haben, ist das Erste, was es zu sagen gilt, dass dies nicht der direkte Vergleich ist, den die Formulierung nahelegt. AutoGen ist ein Framework von Microsoft Research zum Aufbau von Teams von Agenten, die miteinander kommunizieren, um eine Aufgabe zu lösen. Hermes Agent ist ein einzelner, langlebiger Agent von Nous Research, der auf Ihrem Laptop oder einem kleinen VPS läuft, sich über Sitzungen hinweg an Sie erinnert und selbst entscheidet, wie er jede Anfrage bearbeitet.

Beide tragen das Etikett „KI-Agenten-Framework", aber die architektonische Form unterscheidet sich so deutlich, dass die Wahl des falschen Frameworks Sie Wochen kosten wird. Dieser Beitrag erläutert, wofür jedes Projekt tatsächlich optimiert ist, wo die eigentliche Entscheidungsgrenze liegt und wie eine sinnvolle Wahl im Jahr 2026 aussieht.

Was AutoGen tatsächlich macht

AutoGen ist eine quelloffene Bibliothek, die ursprünglich von Microsoft Research stammt, zur Orchestrierung mehrerer LLM-gestützter Agenten in einer Konversation. Die Neuentwicklung von v0.4, die Anfang 2026 veröffentlicht wurde, hat das Projekt um einen asynchronen, ereignisgesteuerten Kern mit einer mehrschichtigen API neu organisiert: eine Low-Level-Laufzeitumgebung, eine aufgabengesteuerte AgentChat-Schicht mit Primitiven wie RoundRobinGroupChat und SelectorGroupChat sowie AutoGen Studio für visuelles Prototyping.

Das mentale Modell ist eine Besprechung. Sie deklarieren eine Reihe von Agenten, jeder mit einer Rolle und einem System-Prompt: ein Planer, ein Programmierer, ein Kritiker, ein Ausführender. Ein Selektor entscheidet, wer als Nächstes spricht. Sie reden abwechselnd, sehen die Nachrichten der anderen und einigen sich auf eine Antwort. Die Stärke liegt darin, dass sich komplexe Aufgaben natürlich zerlegen lassen: Ein Agent schreibt Code, ein anderer überprüft ihn, ein dritter führt ihn aus, ein vierter kritisiert das Ergebnis.

Dafür ist AutoGen gebaut. Pipelines zur Codegenerierung, die so lange iterieren, bis die Tests bestehen. Forschungsworkflows, in denen ein „Researcher" und ein „Writer" über einen Entwurf debattieren. Datenanalysen, bei denen ein Planer-Agent auswählt, welcher Unter-Agent aufgerufen wird. Das Framework entwickelt sich zudem schnell weiter: Microsoft konsolidiert AutoGen und Semantic Kernel zu einem einheitlichen Microsoft Agent Framework, und das Upstream-Repository microsoft/autogen existiert weiterhin neben dem von der Community getriebenen AG2-Fork.

Die Kostenstruktur ist ehrlich, was den Kompromiss angeht. Jede Runde in einem GroupChat ist ein vollständiger LLM-Aufruf mit der gesamten angesammelten Konversationshistorie. Eine Debatte mit vier Agenten über fünf Runden ergibt mindestens zwanzig Aufrufe, zuzüglich der Tool-Aufrufe. Für Anwendungsfälle mit hohem Volumen und geringer Latenz, etwa einen persönlichen Agenten, der innerhalb von zwei Sekunden auf Telegram antworten soll, wird das schnell teuer. AutoGen ist außerdem eine Bibliothek: Sie importieren sie in Python und führen sie innerhalb Ihres eigenen Dienstes aus. Es gibt keinen Telegram-Bot, kein dauerhaftes Gedächtnis über Läufe hinweg, keine Benutzeroberfläche für Endbenutzer. Das bauen Sie selbst.

Was Hermes Agent tatsächlich macht

Hermes Agent ist ein quelloffener KI-Agent von Nous Research, der erstmals am 25. Februar 2026 veröffentlicht wurde und nun bei v0.10.0 angekommen ist. Anders als AutoGen ist er keine Bibliothek, die Sie importieren: Er ist eine Laufzeitumgebung, die Sie starten. Sie installieren ihn einmal, verweisen ihn mit Ihrem eigenen Schlüssel auf einen Modellanbieter, und er läuft als langlebiger Prozess, mit dem Sie über Telegram, WhatsApp, Discord, Slack, Signal oder direkt in einer CLI kommunizieren.

Es gibt einen Agenten. Kein Team rollenspielender Personas. Der einzelne Agent zieht seinen gesamten Vorteil aus drei Zustandsschichten:

Core Memory, gespeichert in ~/.hermes/memories/ und beim Sitzungsstart in den System-Prompt eingefügt: die Dinge, die der Agent stets über Sie wissen sollte.
Session Search: Jede CLI- und Messaging-Sitzung wird in SQLite mit der FTS5-Volltextsuche indexiert, sodass der Agent abrufen kann, was Sie letzte Woche besprochen haben.
Skills, Markdown-Dateien, die der Agent bei Bedarf lädt und, was wichtig ist, aus vergangenen Aufgaben selbst erstellt und anpasst.

Leuchtender grüner Knotengraph auf dunklem Hintergrund, der das dauerhafte Gedächtnis des Agenten über Sitzungen hinweg visualisiert

Die Gedächtnisarchitektur haben wir ausführlich im Beitrag Gedächtnis und Skills von Hermes Agent behandelt. Die Kernaussage: Ein einzelner Agent mit dauerhaftem Zustand und selbst generierten Skills schlägt bei langlaufender persönlicher Arbeit tendenziell eine Multi-Agent-Debatte, weil der Kontext, den die nächste Entscheidung benötigt, bereits vorhanden ist.

Hermes liefert sechs Terminal-Backends: local, Docker, SSH, Daytona, Singularity, Modal, und ist MIT-lizenziert. Selbst gehostet auf einem kleinen europäischen VPS landet man bei rund fünf Euro im Monat. Die Grenzkosten werden von Ihrem Modellanbieter bestimmt, nicht von der Laufzeitumgebung.

Die Entscheidungsgrenze

Eine nützliche Einordnung: AutoGen ist für zustandslose Multi-Agent-Choreografie, die Sie entwerfen, und Hermes ist für einen zustandsbehafteten Einzelagenten, der mit Ihnen wächst.

Frage	AutoGen	Hermes Agent
Kernabstraktion	Team kommunizierender Agenten	Ein langlebiger zustandsbehafteter Agent
Wo Sie sich aufhalten	In einem Python-Dienst, den Sie bauen	Ein Daemon auf Telegram / WhatsApp / Discord / CLI
Orchestrierungslogik	Von Ihnen entworfen (Selektor, Group Chat)	Vom einzelnen Agenten zur Laufzeit entschieden
Zustand über Läufe hinweg	Konversationspuffer pro Aufgabe	Core Memory + Session Search + Skills, dauerhaft
Multi-Agent?	Ja, von Grund auf	Nein, bewusst Einzelagent
Am besten geeignet für	Codegen-Pipelines, Debatte, Plan-Act-Critic-Schleifen	Persönliche Unterstützung, Erinnerung, Entwürfe, Urteilsvermögen
Kostenstruktur	N Agenten x M Runden x voller Kontext pro Aufruf	Ein LLM-Aufruf pro Benutzerrunde + Tool-Aufrufe
Schnittstelle für Endbenutzer	Bauen Sie selbst	Eingebaute Messaging-Integrationen
Lizenz	MIT	MIT
Selbst gehostet	Ja (Sie betreiben den Host-Dienst)	Ja (Docker, SSH, Daytona, Modal und mehr)

Wenn Sie feststellen, dass Sie Ihrem AutoGen-Setup einen „Memory-Agenten" und einen „Benutzerprofil-Agenten" hinzufügen, damit sich das Team Dinge zwischen den Besprechungen merken kann, ist das das Signal: Sie bauen nach, was Hermes von Haus aus mitbringt. Wenn Sie feststellen, dass Sie Hermes-Skills in einen „Planer-Skill" und einen „Kritiker-Skill" aufteilen, die sich in einer festen Reihenfolge gegenseitig aufrufen, ist das das andere Signal: Sie bauen AutoGen innerhalb eines Agenten nach.

Wann AutoGen gewinnt

AutoGen ist die richtige Antwort, wenn:

Die Arbeit aufgabenförmig ist, nicht beziehungsförmig. Ein abgegrenzter Auftrag kommt herein, Agenten arbeiten zusammen, eine Antwort kommt heraus, die Konversation endet.
Sie eine explizite Rollenzerlegung wünschen. Ein „Researcher"-Agent und ein „Writer"-Agent produzieren tatsächlich bessere Entwürfe als ein einzelner Agent, der beides macht, besonders mit Kritikschleifen.
Sie über die technische Kapazität verfügen, einen Python-Dienst zu hosten, die Schnittstelle zu bauen, die Ihre Benutzer brauchen, und die Mehrrunden-LLM-Rechnung zu bezahlen.
Sie in den breiteren Agenten-Stack von Microsoft integrieren, in dem AutoGen-Muster in das Microsoft Agent Framework einfließen.
Ihnen die programmatische Beobachtbarkeit wichtig ist, wer was in welcher Reihenfolge mit welchem Tool-Ergebnis gesagt hat.

Das ist die Kategorie der produktiven Multi-Agent-Systeme. Codegenerierungsdienste, Forschungszusammenfasser, Dokumentenprüfungs-Pipelines, strukturierte analytische Workflows. AutoGen und seine Mitstreiter (LangGraph, CrewAI) beherrschen diesen Bereich.

Wann Hermes gewinnt

Hermes ist die richtige Antwort, wenn:

Die Arbeit Ihre ist, nicht die Ihres Teams. Ein persönlicher Agent, der Ihren Stil, Ihre Projekte, Ihre Kontakte lernt.
Sie ein langlaufendes Gedächtnis über viele Sitzungen hinweg wünschen, nicht einen frischen Konversationspuffer pro Aufgabe.
Die Schnittstelle eine Chat-Oberfläche sein soll, die Sie bereits nutzen, Telegram, WhatsApp, Discord, Signal, und kein Web-Dashboard, das Sie ausliefern.
Sie Fähigkeiten hinzufügen möchten, indem Sie eine Markdown-Skill-Datei schreiben (oder den Agenten eine für Sie schreiben lassen), anstatt eine neue Agentenklasse mit einem System-Prompt zu deklarieren.
Ihnen die Latenz pro Runde wichtig ist. Ein LLM-Aufruf mit dauerhaftem Kontext schlägt fünf Runden von Agenten, die miteinander reden.

Das ist die Kategorie der persönlichen Agenten. Tägliche Zusammenfassungen in Ihrem Ton geschrieben. Schnelle Erinnerungsfragen, beantwortet mit dem Kontext Ihrer Projekte. Wiederkehrendes Journaling, Kuratierung von Leselisten, fokussierte Arbeitsassistenten. Wir haben Hermes mit den wichtigsten reinen Chat-KI-Tools in Hermes Agent vs. ChatGPT, Claude und Gemini verglichen und mit Workflow-Tools in Hermes Agent vs. n8n.

Starten Sie mit Hermify, wenn Sie in unter einer Minute einen verwalteten Hermes Agent auf Telegram zum Laufen bringen möchten.

Der ehrliche Hybrid

Die beiden schließen sich nicht gegenseitig aus. Ein vernünftiges fortgeschrittenes Setup sieht so aus:

AutoGen übernimmt die stoßweise Multi-Agent-Aufgabe. Wenn Sie einen Codegenerierungsauftrag oder einen Forschungslauf auslösen, startet eine AutoGen-Pipeline das passende Agententeam für diesen Auftrag, führt es bis zum Abschluss aus und liefert ein strukturiertes Ergebnis zurück.
Hermes trägt die Beziehung. Ihr persönlicher Hermes Agent ist die Oberfläche, mit der Sie sprechen. Er kennt Sie, erinnert sich an das, was Sie gestern gefragt haben, und entscheidet, wann delegiert wird. Für einen Code-Auftrag ruft er den AutoGen-Dienst über HTTP auf, empfängt das Ergebnis und bringt es Ihnen in der Messaging-App Ihrer Wahl zurück.

In der Praxis bedeutet das: Hermes ist der Ort, an dem der Zustand lebt, und AutoGen ist der Ort, an dem das schwergewichtige Multi-Agent-Reasoning lebt. Eine Skill-Datei in Hermes genügt, um AutoGen als ein weiteres Tool verfügbar zu machen. Die umgekehrte Richtung ist schwieriger: AutoGen hat kein natives Konzept von „dem Benutzer über Sitzungen hinweg", sodass der Aufbau einer Persistenz im Hermes-Stil innerhalb von AutoGen bedeutet, eine Gedächtnisschicht zu schreiben, die Ihre Agenten gemeinsam nutzen.

Einzelner leuchtender KI-Agent rechts, der strukturierte Daten mit einem kleinen Cluster rollenbeschrifteter Agenten links austauscht

Kosten, Hosting und Lock-in

Beide Projekte sind MIT-lizenziert und selbst hostbar. Lock-in ist nicht das Unterscheidungsmerkmal.

Die Kostenstruktur ist es. AutoGen-Workflows werden von der Multi-Agent-Token-Rechnung dominiert: Jeder Agent in einer Debatte zahlt die Kosten dafür, die vollständige Konversation zu sehen, in jeder Runde. Ein einzelner AutoGen-Lauf, der eine durchdachte Antwort auf einen Prompt erzeugt, kann zehn- bis zwanzigmal teurer sein als dieselbe Antwort von einem einzelnen Agenten. Das ist ein Feature, kein Fehler, wenn Sie wirklich eine Debatte brauchen. Es ist eine Steuer, wenn Sie das nicht tun.

Die Grenzkosten von Hermes sind der LLM-Anbieter, auf den Sie ihn verweisen: Ihre Rechnung bei OpenAI, Anthropic oder OpenRouter, wobei die Laufzeitumgebung einen vernachlässigbaren Mehraufwand hinzufügt. Die Kompromisse zwischen Selbst-Hosting und einem verwalteten Setup haben wir in Hermes Agent: verwaltetes Hosting vs. Selbst-Hosting behandelt. Die typische individuelle Nutzung liegt auf der Modellseite im Bereich von fünf bis dreißig Dollar im Monat.

So treffen Sie die Wahl

Eine kurze Zusammenfassung der Entscheidung:

Wenn Ihr Problem lautet „Ich brauche ein Team spezialisierter Agenten, die an einer Aufgabe zusammenarbeiten", wählen Sie AutoGen.
Wenn Ihr Problem lautet „Ich möchte eine KI, die mich kennt und in meinem Namen über Messaging-Apps hinweg handelt", wählen Sie Hermes.
Wenn Ihr Problem lautet „Ich möchte einen persönlichen Agenten, der bei Bedarf auch schwergewichtige Multi-Agent-Aufträge abfertigen kann", betreiben Sie Hermes als Eingangstür und rufen Sie für diese Aufträge AutoGen auf.

Eines der beiden Projekte zur Aufgabe des anderen zu zwingen, ist der Fehlermodus. AutoGen ist keine Laufzeitumgebung für persönliche Agenten, und Hermes ist kein Framework für Multi-Agent-Debatten. Sobald Sie akzeptieren, dass die beiden unterschiedliche Probleme lösen, wird die Wahl einfach, und das Hybrid-Muster fängt an, offensichtlich zu wirken.