KI-Agent vs. Chatbot: Der wahre Unterschied im Jahr 2026

Sie bitten einen Support-Chatbot um eine Rückerstattung. Er liefert eine höfliche Antwort mit einem Link zu den Richtlinien und wartet auf Ihre nächste Nachricht. Sie bitten einen ordentlich gebauten KI-Agenten um eine Rückerstattung. Er sucht die Bestellung heraus, prüft die Richtlinien, eröffnet ein Ticket, bucht die Gutschrift, wenn sie den Regeln entspricht, und teilt Ihnen in einem Satz mit, was er getan hat. Beide haben ein Sprachmodell verwendet. Nur einer hat die Aufgabe abgeschlossen.

Im Jahr 2026 werden die Begriffe „Chatbot" und „KI-Agent" im Marketing austauschbar verwendet, und das ist ein Problem, wenn Sie tatsächlich Software auswählen. Der Unterschied ist keine Frage des Markenauftritts. Es ist ein architektonischer Unterschied darüber, was das System zwischen den Gesprächsrunden tun darf, woran es sich über sie hinweg erinnert und ob es in der Außenwelt handeln kann, ohne dass Sie es an der Hand führen müssen. Dieser Beitrag erklärt diesen Unterschied in klaren Worten und hilft Ihnen, den richtigen für das Problem vor Ihnen zu wählen.

Die Unterscheidung zwischen Nur-Lesen und Lesen-Schreiben

Die sauberste Zusammenfassung in einem Satz lautet: Ein Chatbot liest und antwortet; ein KI-Agent liest, schreibt und handelt.

Chatbots sind dialogorientierte Schnittstellen über einer Wissensdatenbank oder einem Sprachmodell. Sie senden Text, sie geben Text zurück. Im Hintergrund konsultieren sie vielleicht eine FAQ, einen Vektorindex oder ein feinabgestimmtes Modell, aber das Grundprinzip ist dasselbe: Text rein, Text raus, und das Gespräch geht nur weiter, wenn Sie es fortsetzen.

KI-Agenten sind Laufzeitumgebungen. Das Sprachmodell ist eine Komponente innerhalb einer Schleife, die auch Werkzeuge, Gedächtnis und einen Planer umfasst. Der Agent entscheidet, was als Nächstes zu tun ist, ruft ein Werkzeug auf, beobachtet das Ergebnis und entscheidet erneut. Er macht weiter, bis das Ziel erreicht ist oder er aufgibt. Das Gespräch ist ein Kanal in den Agenten hinein, nicht das gesamte Produkt.

Deshalb hat sich Gartner so unverblümt über den Markt geäußert: Das Unternehmen berichtete, dass von Tausenden Anbietern, die ihr Produkt einen „KI-Agenten" nennen, nur etwa 130 nach irgendeinem aussagekräftigen architektonischen Maßstab nachweislich agentenartig sind. Die meisten der übrigen sind Chatbots in einer neuen Hülle.

Zwei nebeneinander angeordnete Flussdiagramme. Das linke ist ein einfacher einseitiger Textfluss mit der Bezeichnung Chatbot. Das rechte ist eine geschlossene Schleife mit der Bezeichnung Agent, mit Pfeilen zwischen Denken, Handeln, Beobachten und einem kleinen Kasten mit der Bezeichnung Gedächtnis

Fünf Dimensionen, die sie tatsächlich unterscheiden

Nehmen Sie einen beliebigen ehrlichen Vergleich von einem Anbieter, der beides baut, und es kommen dieselben fünf Dimensionen auf. Sie sind nützlich, weil jede einzelne überprüfbar ist.

1. Schlussfolgern

Ein Chatbot ordnet Ihre Frage einer Antwort zu. Die Zuordnung kann ein Entscheidungsbaum, ein Abruf über Dokumente oder ein einzelner LLM-Aufruf sein, aber es ist ein einziger Schritt.

Ein Agent schlussfolgert in einer Schleife. Das dominierende Muster ist ReAct, aus einem Papier von Yao et al. aus dem Jahr 2022 an der Princeton University und bei Google: Das Modell denkt über den Zustand nach, wählt eine Aktion, beobachtet das Ergebnis und denkt dann erneut nach. Diese Schleife ist es, die einem Agenten ermöglicht, „finde den günstigsten Flug, der mir erlaubt, meinen Dienstagstermin zu behalten, und buche ihn" zu bewältigen, anstatt nur eine Liste von Flügen zurückzugeben.

2. Werkzeugnutzung

Chatbots reden. Agenten rufen Werkzeuge auf: APIs, Shell-Befehle, Datenbanken, MCP-Server, Suche, E-Mail, Kalender, Browser. Das Model Context Protocol hat den Werkzeugzugriff von einer maßgeschneiderten Integrationsaufgabe in ein Plug-in-Muster verwandelt, und die öffentliche Anzahl der MCP-Server wuchs von rund 500 Ende 2025 auf zwischen 10.000 und 12.000 ein Jahr später. Wenn ein System nicht über sein eigenes Gesprächsfenster hinausreichen kann, ist es ein Chatbot.

3. Gedächtnis

Chatbots sind sitzungsübergreifend in der Regel zustandslos. Sie erinnern sich an das aktuelle Gespräch im Kontextfenster und vergessen es, wenn die Sitzung endet. „Gedächtnis"-Funktionen im Stil von ChatGPT speichern eine kleine Menge zusammengefasster Fakten, was nützlich ist, aber auf etwa 1.400 Wörter begrenzt und für den Nutzer undurchsichtig ist.

Agenten verfügen über eine dafür entworfene Gedächtnisschicht: Vektorspeicher, Wissensgraphen oder einfache Markdown-Dateien auf der Festplatte. Das Gedächtnis übersteht Neustarts, kann vom Nutzer eingesehen und bearbeitet werden und fließt bei jeder Gesprächsrunde in die Schlussfolgerungsschleife ein. Mehr Tiefe zu den Architekturen finden Sie unter KI-Assistent mit dauerhaftem Gedächtnis.

4. Handeln und Autonomie

Der Wirkungsradius eines Chatbots ist eine Antwort. Der Wirkungsradius eines Agenten ist alles, was seine Werkzeuge erlauben: eine Rückerstattung, eine Kalendereinladung, eine Bereitstellung, ein Datenbankschreibvorgang. Das ist der ganze Sinn und zugleich das ganze Risiko. Agenten bringen Berechtigungsmodelle, Positivlisten, Probelaufmodi und Human-in-the-Loop-Schranken mit. Chatbots brauchen sie nicht.

5. Lernen zwischen Sitzungen

Chatbots verbessern sich, wenn Sie sie neu trainieren. Agenten verbessern sich auf zwei zusätzliche Weisen. Manche speichern Skills: wiederverwendbare Abläufe, die der Agent selbst beim ersten Mal schreibt, wenn er etwas herausfindet, und die bei der nächsten ähnlichen Aufgabe wortgetreu wiederholt werden. Manche pflegen Nutzerprofile, die mit jeder Interaktion wachsen. Die Modellgewichte ändern sich nicht; die Arbeitsnotizen des Agenten schon.

Wann ein Chatbot die richtige Antwort ist

Alles einen Agenten zu nennen, ist ein Kategorienfehler. Viele reale Probleme werden von einem Chatbot gut bedient, und einen Agenten dafür überzukonstruieren ist verschwendetes Geld.

Verwenden Sie einen Chatbot, wenn:

Sich die Fragen eng um eine kleine Anzahl von Anliegen gruppieren (Rücksendungen, Geschäftszeiten, Passwort-Zurücksetzung).
Die Antwort in Ihren Dokumenten steht und der Nutzer die Dokumente schneller haben möchte.
Die Kosten einer falschen Aktion viel höher sind als die Kosten einer verpassten Hilfestellung, sodass Sie autonomes Handeln von vornherein gar nicht wollen.
Sie eine vorhersehbare Latenz und Kosten pro Interaktion wünschen, ohne dass Werkzeugaufrufe eines von beiden in die Höhe treiben.

Ein Chatbot beantwortet den ganzen Tag Kundensupport-Fragen zu einem Bruchteil der Kosten eines Agenten. Wenn die Aufgabe lautet „beantworte diese Frage aus unserer Wissensdatenbank", gibt es keinen Grund, einen Planer und eine Werkzeugschleife hinzuzufügen.

Wann Sie tatsächlich einen Agenten brauchen

Das Signal, dass Sie einen Agenten und keinen Chatbot brauchen, ist mehrstufige Arbeit mit Nebenwirkungen. Wenn eine erfolgreiche Interaktion erfordert, dass das System mehrere Dinge in einer bestimmten Reihenfolge tut, einen Zustand von irgendwoher liest, einen Zustand irgendwo anders hinschreibt und je nach Vorgefundenem zwischen Wegen entscheidet, dann beschreiben Sie einen Agenten.

Konkrete Beispiele aus realen Einsätzen:

Ein Telegram-Assistent, der eingehende Nachrichten liest, Antworten in Ihrem Stil entwirft, den Kalendertermin bucht und die Bestätigung sendet, ganz ohne dass Sie zwischen Apps wechseln müssen.
Ein DevOps-Helfer, der eine GitHub Action überwacht, einen Entwurf-PR mit einer Korrektur eröffnet, wenn ein bekanntes Fehlermuster auftaucht, und nur dann den Bereitschaftsdienst benachrichtigt, wenn die Korrektur nicht funktioniert.
Ein Vertriebsagent, der einen Interessenten recherchiert, die Erstansprache entwirft, die Nachfassaktion plant und das CRM aktualisiert, und Sie dann um Freigabe für den Versand bittet.

Das sind keine Chat-Gespräche. Der Chat ist das Lenkrad; das Auto ist der Agent.

Gartner prognostiziert, dass bis Ende 2026 40 % der Unternehmensanwendungen aufgabenspezifische KI-Agenten enthalten werden, gegenüber unter 5 % im Jahr 2025, und dass KI-Agenten bis 2029 80 % der häufigen Kundenservice-Probleme autonom lösen werden. Der Wandel ist real. Er ist auch der Grund, warum der Vorbehalt des „Agent-Washing" wichtig ist: Die meisten heute als Agenten vermarkteten Produkte sind nicht wie einer gebaut, und Sie können das feststellen, indem Sie prüfen, ob sie eine mehrstufige Aufgabe abschließen können, ohne dass Sie sie babysitten müssen.

Eine dunkle Fotografie einer kleinen Werkbank mit einem aufgeschlagenen Notizbuch voller handgeschriebener Skill-Rezepte, einem Laptop, der ein Terminal mitten in einer Aufgabe zeigt, und einem Telefon auf einem Ständer, das einen Telegram-Chat anzeigt, wobei die drei Oberflächen des Agenten zusammenarbeiten

Wie Sie sie in 60 Sekunden auseinanderhalten

Wenn Ihnen ein Anbieter „einen KI-Agenten" vorführt, machen Sie drei schnelle Tests.

Bitten Sie ihn, etwas mit zwei Schritten und einer realen Nebenwirkung zu tun. „Finde meine letzte Stripe-Rechnung und schicke mir das PDF per E-Mail." Ein Chatbot wird erklären, wie man das macht. Ein Agent wird es tun.
Schließen Sie den Tab und kommen Sie morgen wieder. Erwähnen Sie etwas Konkretes aus dem gestrigen Gespräch. Ein Chatbot hat keine Ahnung, was Sie meinen. Ein Agent ruft das Gedächtnis ab und macht weiter.
Fragen Sie, auf welche Werkzeuge er Zugriff hat. Ein Chatbot wird Fähigkeiten auflisten („Ich kann Fragen zu Ihrem Konto beantworten"). Ein Agent wird Werkzeuge auflisten („Stripe, Gmail, GitHub, Postgres, Ihr Kalender") und Ihnen sagen, welche für Ihr Konto erlaubt sind.

Wenn ein Produkt bei allen drei Tests durchfällt, ist es ein Chatbot. Das ist keine Beleidigung, Chatbots sind nützlich. Aber Sie wählen die falsche Software-Klasse, wenn Sie einen Agenten gebraucht hätten.

Wo Hermes Agent ins Bild passt

Wenn Ihre Agenten-Kriterien von oben dem entsprechen, was Sie tatsächlich brauchen, ist Hermes Agent eine der quelloffenen Optionen, die man kennen sollte. Er läuft als ein einzelner, stets aktiver persönlicher Agent statt als Framework zur Orchestrierung mehrerer Agenten, wird mit dauerhaftem Gedächtnis in einfachem Markdown ausgeliefert, unterstützt MCP und verbindet sich mit Telegram, Discord, Slack, WhatsApp und E-Mail als native Oberflächen. Er ist BYOK (OpenAI, Anthropic, OpenRouter, eigene Endpunkte), MIT-lizenziert und auf einem 5-$-VPS selbst hostbar.

Hermes ist eine Option unter mehreren: CrewAI für die Orchestrierung mehrerer Agenten, AutoGen für Forschungs-Workflows, OpenAI Assistants API für die gehostete Nutzung und ein langer Schwanz weiterer Frameworks. Für einen direkten Vergleich, wo jede davon hineinpasst, siehe Hermes Agent vs. CrewAI.

Wenn Sie die Laufzeitumgebung nicht selbst verwalten möchten, hostet Hermify einen verwalteten Hermes Agent für 19 bis 59 $/Monat, bei dem Gedächtnis, Skills, MCP und Telegram bereits eingerichtet sind. Starten Sie mit Hermify und Sie können in weniger als fünf Minuten einen echten Agenten (keinen Chatbot) in Ihrem Telegram laufen haben.

Das Fazit

Die Unterscheidung zwischen Chatbot und Agent ist kein bloßes Gefühl. Es ist eine Frage dessen, ob das System in einer Schleife schlussfolgern, Werkzeuge nutzen, sich über Sitzungen hinweg erinnern und mit begrenzter Autonomie handeln kann. Wenn es alle vier kann, ist es ein Agent. Wenn es keines davon kann, ist es ein Chatbot. Wenn es einige davon kann, ist es ein Hybrid, und Sie sollten wissen, welche, denn das bestimmt, was das Produkt tatsächlich für Sie abschließen kann.

Wählen Sie die richtige Klasse für die Aufgabe. Verwenden Sie einen Chatbot, wenn die Aufgabe darin besteht, Fragen zu beantworten. Verwenden Sie einen Agenten, wenn die Aufgabe darin besteht, Arbeit zu erledigen.