Selbst gehosteter KI-Agent in Docker: Ein praktischer Leitfaden für 2026
Wie Sie einen selbst gehosteten KI-Agenten in Docker betreiben, ohne ein Wochenende zu verlieren. Architektur, Kompromisse und die Optionen, die 2026 wirklich funktionieren.

Warum Docker der Standardweg ist, um einen selbst gehosteten KI-Agenten zu betreiben
Wenn Sie sich entschieden haben, einen KI-Agenten auf Ihrer eigenen Infrastruktur zu betreiben, anstatt eine monatliche SaaS-Gebühr zu zahlen, werden Sie ihn mit ziemlicher Sicherheit über Docker laufen lassen. Jede ernstzunehmende Open-Source-Agenten-Laufzeitumgebung liefert 2026 ein Dockerfile oder eine docker-compose.yml mit. Das Muster hat sich durchgesetzt, weil Container vier Probleme auf einmal lösen, die beim Selbsthosten eines Agenten auftauchen: die Python- oder Node-Laufzeitversion, die Systemabhängigkeiten für Audio oder Vision, die Netzwerkoberfläche, die für Telegram- oder Slack-Webhooks freigegeben werden muss, und der persistente Zustand (eine Datenbank und ein Vektorspeicher), den der Agent über Neustarts hinweg benötigt.
Dieser Beitrag zeigt, wie der Betrieb eines selbst gehosteten KI-Agenten in Docker 2026 tatsächlich aussieht: die Architektur, die Plattformen, die es zu kennen lohnt, die Kompromisse, auf die Sie sich einlassen, und das günstigste Setup, das einen Neustart übersteht. Er ist für jemanden geschrieben, der bereits Docker verwendet hat, aber noch keinen Agenten-Stack ausgewählt hat.
Was „selbst gehosteter KI-Agent" in der Praxis bedeutet
Der Begriff umfasst eine breite Palette von Produkten. Bevor Sie ein Docker-Image auswählen, teilen Sie sie in drei Kategorien ein.
Workflow-Agenten sind visuelle oder Low-Code-Plattformen, auf denen Sie Bausteine miteinander verdrahten, um einen Agenten zusammenzustellen. n8n, Dify und Flowise sind die kanonischen Beispiele. Sie laufen als Web-App, bei der Sie sich anmelden, und der Agent ist ein Workflow, den Sie entwerfen und auslösen. Gut geeignet, wenn Sie eine grafische Benutzeroberfläche und mehr als 400 vorgefertigte Integrationen wünschen.
Code-First-Agenten-Frameworks sind Bibliotheken, gegen die Sie Python oder TypeScript schreiben. LangChain oder LangGraph, AutoGen, CrewAI und das OpenAI Agents SDK gehören hierher. Sie liefern Ihren Code als Docker-Image aus. Gut geeignet, wenn Sie ein Entwickler sind, der die volle Kontrolle über den Prompt, die Werkzeuge und den Zustandsautomaten haben möchte.
Laufzeit-Agenten sind vorgefertigte Agenten, die Sie selbst hosten und mit Ihrer eigenen Messaging-App (Telegram, Slack, WhatsApp, Signal, E-Mail) verbinden. Hermes Agent, OpenHands und Agent Zero sind Beispiele. Sie schreiben die Agenten-Schleife nicht selbst, sie wird ausgeliefert. Sie bringen einen API-Schlüssel mit, Sie bringen einen Server mit, und Sie sprechen von Ihrem Telefon aus mit ihm.
Das Docker-Rezept ist für alle drei ähnlich. Die Unterschiede liegen darin, was Sie um den Container herum platzieren: eine Datenbank für persistenten Speicher, einen Vektorspeicher für die semantische Suche und einen Webhook-Empfänger für die jeweilige Messaging-App, die Sie anbinden.

Die Referenzarchitektur
Fast jeder selbst gehostete KI-Agent in Docker sieht am Ende so aus:
| Komponente | Typisches Image | Was es tut |
|---|---|---|
| Agenten-Laufzeit | Eigenes Image oder ghcr.io/<project>/<agent> |
Die Agenten-Schleife: empfängt Eingaben, ruft das LLM auf, führt Werkzeuge aus |
| LLM-Gateway | ollama/ollama für lokal oder externe API |
Das Modell selbst oder ein Proxy zu OpenAI / Anthropic / OpenRouter |
| Relationale DB | postgres:16 |
Konversationen, Benutzerzustand, geplante Aufgaben |
| Vektorspeicher | qdrant/qdrant oder pgvector innerhalb von Postgres |
Langzeitgedächtnis, semantische Suche, RAG |
| Reverse-Proxy | traefik oder caddy |
TLS-Terminierung, Webhook-Routing |
| Messaging-Adapter | Innerhalb des Agenten-Images | Telegram-, Slack-, Discord-, WhatsApp-, Signal-Connectoren |
Sie werden nicht jede Ebene benötigen. Wenn Ihr Agent nur Text verarbeitet und eine externe LLM-API verwendet, können Sie Ollama überspringen. Wenn Ihre Messaging-App Long-Polling anstelle von Webhooks verwendet (Telegram unterstützt beides), können Sie den Reverse-Proxy überspringen. Der minimal funktionsfähige Stack auf einem einzelnen $5-VPS besteht aus der Agenten-Laufzeit plus Postgres, wobei das Modell über eine externe API aufgerufen wird. Das sind ungefähr drei bis vier Container in einer einzigen docker-compose.yml.
Eine minimale docker-compose.yml
Für die meisten persönlichen oder kleinen Team-Agenten hat die Compose-Datei diese Form. Ersetzen Sie your-agent-image durch die von Ihnen gewählte Laufzeit.
services:
agent:
image: your-agent-image:latest
restart: unless-stopped
environment:
DATABASE_URL: postgres://agent:agent@db:5432/agent
MODEL_PROVIDER: openai
OPENAI_API_KEY: ${OPENAI_API_KEY}
TELEGRAM_BOT_TOKEN: ${TELEGRAM_BOT_TOKEN}
depends_on:
- db
ports:
- "127.0.0.1:8080:8080"
db:
image: postgres:16-alpine
restart: unless-stopped
environment:
POSTGRES_USER: agent
POSTGRES_PASSWORD: agent
POSTGRES_DB: agent
volumes:
- db-data:/var/lib/postgresql/data
volumes:
db-data:
Drei Punkte sind hervorzuheben. Der Agenten-Port ist an 127.0.0.1 statt an 0.0.0.0 gebunden, weil ein öffentlicher Messaging-Webhook über einen Reverse-Proxy ankommen sollte, der TLS terminiert, und nicht direkt an einem rohen Container-Port. Geheimnisse liegen in einer .env-Datei neben der Compose-Datei (und niemals in git). Das Postgres-Volume ist benannt, damit docker compose es über Neustarts hinweg erhält; verlieren Sie dieses Volume, verlieren Sie das Gedächtnis Ihres Agenten.
Die 2026 erwähnenswerten Optionen
Hier ist die Kurzliste der Open-Source-Agenten-Stacks, die Docker-Images ausliefern und 2026 an Dynamik gewinnen.
| Projekt | Typ | Lizenz | Messaging-Integrationen | Anmerkungen |
|---|---|---|---|---|
| Hermes Agent | Laufzeit | MIT | Telegram, Slack, Discord, WhatsApp, Signal, E-Mail | Persistenter Speicher, BYOK-Modellanbieter, autonome Skill-Erstellung |
| n8n | Workflow | Sustainable Use | 400+ über Nodes | Visueller Workflow-Builder, großer Integrationskatalog |
| Dify | Workflow | Apache 2.0 | Web-Oberfläche, einbettbare Widgets | RAG-First, Prompt-Orchestrierung, integriertes Monitoring |
| Flowise | Workflow | Apache 2.0 | Web-Oberfläche, REST-/Slack-/Telegram-Nodes | Drag-and-Drop-LangChain |
| LangGraph | Framework | MIT | Was auch immer Sie verdrahten | Code-First, tiefe Zustandsgraphen |
| AutoGen | Framework | CC-BY 4.0 (Microsoft) | Was auch immer Sie verdrahten | Multi-Agenten-Konversation |
| OpenHands | Laufzeit | MIT | Web-Oberfläche, IDE | Software-Engineering-Agent in einem isolierten Docker |
| Agent Zero | Laufzeit | MIT | Web-Oberfläche, Terminal | Autonomer Computer-Use-Agent |
Die Aufteilung ist wichtig, weil die richtige Wahl davon abhängt, wofür Sie den Agenten einsetzen möchten. Eine Workflow-Plattform ist die richtige Wahl, wenn Sie einen Geschäftsprozess mit 14 Schritten und 5 externen APIs automatisieren möchten. Ein Framework ist die richtige Wahl, wenn Sie ein eigenes Produkt entwickeln. Eine Laufzeit ist die richtige Wahl, wenn Sie einen persönlichen Agenten möchten, der über eine Messaging-App auf Ihrem Telefon lebt und sich an Sie erinnert.
Für den Messaging-zentrierten persönlichen Anwendungsfall lässt sich Hermes Agent direkt mit n8n vergleichen für die Workflow-Seite und mit LangChain für die Framework-Seite.
Die echten Kompromisse
Selbsthosten in Docker ist nicht kostenlos, auch wenn die Binärdateien es sind. Die ehrliche Liste der Kompromisse für 2026:
Sie sind für die Verfügbarkeit verantwortlich. Ein verwalteter Agentenanbieter überwacht Prozesse, startet abgestürzte Container neu und ruft um 3 Uhr morgens jemanden an, wenn ein Release die Produktion lahmlegt. Auf einem selbst gehosteten VPS sind das Sie, selbst wenn Sie restart: unless-stopped konfiguriert haben. Docker startet Container neu; es repariert kein beschädigtes Postgres-Volume und kein abgelaufenes Telegram-Bot-Token.
Sie besitzen die Daten, vollständig. Das ist der Vorteil, der die Kompromisse für die meisten Leser lohnenswert macht. Ihre Konversationen, Ihre Kundennotizen, Ihre Kontaktliste, nichts davon berührt einen Dritten außer dem von Ihnen gewählten LLM-Anbieter. EU-Nutzer, die auf einem EU-VPS laufen, erhalten GDPR-Datenresidenz ohne Papierkram. Nutzer im Gesundheits- oder Buchhaltungswesen, die auf von ihnen kontrollierter Hardware laufen, erhalten eine belastbare Antwort auf die Frage „Wo liegen die Daten?".
Sie tragen die Modellkosten. Die Verwendung Ihres eigenen API-Schlüssels (BYOK) kostet für einen persönlichen Agenten in der Regel ein paar Dollar pro Monat statt der über $20, die ein gehostetes Äquivalent berechnet. Die Kehrseite ist, dass Sie ein OpenAI- oder Anthropic-Guthaben aufladen und im Auge behalten müssen.
Sie sind für das Upgrade verantwortlich. Ein neueres Image zu ziehen ist ein einziger Befehl, aber das Changelog zu lesen und das Datenbankschema zu migrieren ist es nicht. Planen Sie alle paar Monate ein 15-minütiges Zeitfenster ein.
Sie besitzen das LLM nicht. Sofern Sie nicht Ollama oder vLLM lokal auf einer GPU betreiben, ist das Modell selbst immer noch ein API-Aufruf an OpenAI, Anthropic, Google, Mistral oder ein OpenRouter-Aggregat. Selbst gehostet bedeutet 2026 in der Regel selbst gehostete Laufzeit, nicht selbst gehostete Gewichte. Das ist in Ordnung, denn die Laufzeit ist der Ort, an dem 90 % der Datensensibilität liegen.
Wenn diese Kompromisse für Sie akzeptabel klingen, ist der Vorteil bedeutsam. Selbst gehostete Infrastruktur zeigt über 18 Monate hinweg eine Reduzierung der Gesamtbetriebskosten von etwa 55 % gegenüber gleichwertigem SaaS, mit Latenzvorteilen in der Größenordnung von 18 ms, wenn das Modell ebenfalls lokal ist. Für die meisten Leser tritt der Kostenvorteil früher ein, etwa ab dem dritten Monat.
Wie das günstigste Setup aussieht
Eine praktische Basis für 2026 für einen selbst gehosteten Ein-Personen-Agenten:
- Ein VPS für $5 bis $10 pro Monat (Hetzner, Vultr, Contabo) mit 2 GB RAM
- Docker und Docker Compose installiert
- Ein Reverse-Proxy (Caddy ist am einfachsten für automatisches TLS) auf Port 443
- Ein Agenten-Laufzeit-Container, ein Postgres-Container
- Ein Modell-API-Schlüssel, aufgeladen mit $5 bis $10
- Ein Messaging-Bot (ein Telegram-Bot ist am schnellsten einzurichten)
Monatliche Gesamtrechnung: ungefähr $7 bis $20 je nach Nutzung, wovon $4 bis $10 auf API-Tokens entfallen und der Rest auf den VPS. Das Setup dauert 15 bis 30 Minuten, wenn Sie schon einmal Docker verwendet haben; eher einen Abend, wenn nicht. Die VPS-Dimensionierungsrechnung finden Sie in unserem speziellen Beitrag über günstiges VPS-Hosting für einen KI-Agenten, und die Kostenrechnung zwischen selbst gehostet und verwaltet finden Sie hier.

Wann Selbsthosten die falsche Antwort ist
Eine kurze Liste von Fällen, in denen der Docker-Weg das falsche Werkzeug ist.
- Sie benötigen null Betriebsaufwand und Ihr Team toleriert keinerlei Ausfallzeiten. Zahlen Sie für eine verwaltete Laufzeit.
- Sie wollen Anbieter-SLAs und eine Telefonnummer, die Sie anrufen können. Verwaltet.
- Sie haben weniger als eine Stunde Geduld für die anfängliche Einrichtung. Verwaltet.
- Ihr Agent muss morgen elastisch auf Tausende gleichzeitiger Nutzer skalieren. Eine verwaltete, Kubernetes-gestützte Laufzeit ist den Aufpreis wert.
Für alle anderen, Solo-Gründer, unabhängige Entwickler, kleine Firmen, datenschutzsensible Fachleute, Hobbyisten, ist Docker auf einem kleinen VPS der Weg mit dem besten Verhältnis von Kontrolle zu Einrichtungszeit.
Wo Hermes hineinpasst
Hermify ist eine MIT-lizenzierte, selbst gehostete KI-Agenten-Laufzeit, die als Docker-Image ausgeliefert wird. Sie bringen Ihren eigenen Modellanbieter-Schlüssel mit (OpenAI, Anthropic, OpenRouter, Mistral oder andere), Sie betreiben den Container auf einem VPS oder Ihrer eigenen Maschine, und Sie sprechen über Telegram, Slack, Discord, WhatsApp, Signal oder E-Mail mit ihm. Er behält persistenten Speicher über Konversationen hinweg, lernt wiederverwendbare Skills aus Ihrer Nutzung und hält sich die übrige Zeit aus Ihrem Weg. Er ist eine Option unter den oben aufgeführten Laufzeiten; er ist zufällig diejenige, die wir pflegen.
Wenn die Form des persönlichen Agenten auf Ihrem Telefon das ist, was Sie wollen, und Sie eine Stunde Zeit haben, um einen Docker-Container hinter einen Reverse-Proxy zu setzen, legen Sie mit Hermify los. Wenn Sie den VPS lieber ganz überspringen und ihn von uns betreiben lassen möchten, kümmert sich die verwaltete Stufe um den Container, Postgres, TLS und die Updates, während Sie Ihren eigenen Modellschlüssel behalten.
Quellen
- Self-hosted AI Starter Kit - n8n / GitHub
- Docker for AI: The Agentic AI Platform - Docker
- Compose for Agents - docker/compose-for-agents GitHub
- Self-Hosting AI in 2026: 55% TCO Reduction - DEV Community
- 12 Best Open Source AI Agents You Can Self-Host in 2026 - Paxrel
- How to Self-Host n8n with Docker - DEV Community
- Agent Zero AI - Open Source Agentic Framework
Betreiben Sie Ihren eigenen Hermes Agent
Bringen Sie Ihren API-Schlüssel mit, verbinden Sie Telegram und erhalten Sie in 60 Sekunden einen selbstlernenden KI-Agenten.
Loslegen