Zurück zum Blog
AI AgentsDockerSelf-Hosting

Selbst gehosteter KI-Agent in Docker: Ein praktischer Leitfaden für 2026

Wie Sie einen selbst gehosteten KI-Agenten in Docker betreiben, ohne ein Wochenende zu verlieren. Architektur, Kompromisse und die Optionen, die 2026 wirklich funktionieren.

Von Hermify Team||9 Min. Lesezeit
Ein dunkles Terminal, das einen docker compose up-Befehl zeigt, der einen KI-Agenten-Container mit einer grünen Statusanzeige startet

Warum Docker der Standardweg ist, um einen selbst gehosteten KI-Agenten zu betreiben

Wenn Sie sich entschieden haben, einen KI-Agenten auf Ihrer eigenen Infrastruktur zu betreiben, anstatt eine monatliche SaaS-Gebühr zu zahlen, werden Sie ihn mit ziemlicher Sicherheit über Docker laufen lassen. Jede ernstzunehmende Open-Source-Agenten-Laufzeitumgebung liefert 2026 ein Dockerfile oder eine docker-compose.yml mit. Das Muster hat sich durchgesetzt, weil Container vier Probleme auf einmal lösen, die beim Selbsthosten eines Agenten auftauchen: die Python- oder Node-Laufzeitversion, die Systemabhängigkeiten für Audio oder Vision, die Netzwerkoberfläche, die für Telegram- oder Slack-Webhooks freigegeben werden muss, und der persistente Zustand (eine Datenbank und ein Vektorspeicher), den der Agent über Neustarts hinweg benötigt.

Dieser Beitrag zeigt, wie der Betrieb eines selbst gehosteten KI-Agenten in Docker 2026 tatsächlich aussieht: die Architektur, die Plattformen, die es zu kennen lohnt, die Kompromisse, auf die Sie sich einlassen, und das günstigste Setup, das einen Neustart übersteht. Er ist für jemanden geschrieben, der bereits Docker verwendet hat, aber noch keinen Agenten-Stack ausgewählt hat.

Was „selbst gehosteter KI-Agent" in der Praxis bedeutet

Der Begriff umfasst eine breite Palette von Produkten. Bevor Sie ein Docker-Image auswählen, teilen Sie sie in drei Kategorien ein.

Workflow-Agenten sind visuelle oder Low-Code-Plattformen, auf denen Sie Bausteine miteinander verdrahten, um einen Agenten zusammenzustellen. n8n, Dify und Flowise sind die kanonischen Beispiele. Sie laufen als Web-App, bei der Sie sich anmelden, und der Agent ist ein Workflow, den Sie entwerfen und auslösen. Gut geeignet, wenn Sie eine grafische Benutzeroberfläche und mehr als 400 vorgefertigte Integrationen wünschen.

Code-First-Agenten-Frameworks sind Bibliotheken, gegen die Sie Python oder TypeScript schreiben. LangChain oder LangGraph, AutoGen, CrewAI und das OpenAI Agents SDK gehören hierher. Sie liefern Ihren Code als Docker-Image aus. Gut geeignet, wenn Sie ein Entwickler sind, der die volle Kontrolle über den Prompt, die Werkzeuge und den Zustandsautomaten haben möchte.

Laufzeit-Agenten sind vorgefertigte Agenten, die Sie selbst hosten und mit Ihrer eigenen Messaging-App (Telegram, Slack, WhatsApp, Signal, E-Mail) verbinden. Hermes Agent, OpenHands und Agent Zero sind Beispiele. Sie schreiben die Agenten-Schleife nicht selbst, sie wird ausgeliefert. Sie bringen einen API-Schlüssel mit, Sie bringen einen Server mit, und Sie sprechen von Ihrem Telefon aus mit ihm.

Das Docker-Rezept ist für alle drei ähnlich. Die Unterschiede liegen darin, was Sie um den Container herum platzieren: eine Datenbank für persistenten Speicher, einen Vektorspeicher für die semantische Suche und einen Webhook-Empfänger für die jeweilige Messaging-App, die Sie anbinden.

Ein diagrammartiges Bild, das einen Docker-Container mit Pfeilen zu einer Postgres-Datenbank, einem Vektorspeicher und einem Telegram-Webhook zeigt

Die Referenzarchitektur

Fast jeder selbst gehostete KI-Agent in Docker sieht am Ende so aus:

Komponente Typisches Image Was es tut
Agenten-Laufzeit Eigenes Image oder ghcr.io/<project>/<agent> Die Agenten-Schleife: empfängt Eingaben, ruft das LLM auf, führt Werkzeuge aus
LLM-Gateway ollama/ollama für lokal oder externe API Das Modell selbst oder ein Proxy zu OpenAI / Anthropic / OpenRouter
Relationale DB postgres:16 Konversationen, Benutzerzustand, geplante Aufgaben
Vektorspeicher qdrant/qdrant oder pgvector innerhalb von Postgres Langzeitgedächtnis, semantische Suche, RAG
Reverse-Proxy traefik oder caddy TLS-Terminierung, Webhook-Routing
Messaging-Adapter Innerhalb des Agenten-Images Telegram-, Slack-, Discord-, WhatsApp-, Signal-Connectoren

Sie werden nicht jede Ebene benötigen. Wenn Ihr Agent nur Text verarbeitet und eine externe LLM-API verwendet, können Sie Ollama überspringen. Wenn Ihre Messaging-App Long-Polling anstelle von Webhooks verwendet (Telegram unterstützt beides), können Sie den Reverse-Proxy überspringen. Der minimal funktionsfähige Stack auf einem einzelnen $5-VPS besteht aus der Agenten-Laufzeit plus Postgres, wobei das Modell über eine externe API aufgerufen wird. Das sind ungefähr drei bis vier Container in einer einzigen docker-compose.yml.

Eine minimale docker-compose.yml

Für die meisten persönlichen oder kleinen Team-Agenten hat die Compose-Datei diese Form. Ersetzen Sie your-agent-image durch die von Ihnen gewählte Laufzeit.

services:
  agent:
    image: your-agent-image:latest
    restart: unless-stopped
    environment:
      DATABASE_URL: postgres://agent:agent@db:5432/agent
      MODEL_PROVIDER: openai
      OPENAI_API_KEY: ${OPENAI_API_KEY}
      TELEGRAM_BOT_TOKEN: ${TELEGRAM_BOT_TOKEN}
    depends_on:
      - db
    ports:
      - "127.0.0.1:8080:8080"

  db:
    image: postgres:16-alpine
    restart: unless-stopped
    environment:
      POSTGRES_USER: agent
      POSTGRES_PASSWORD: agent
      POSTGRES_DB: agent
    volumes:
      - db-data:/var/lib/postgresql/data

volumes:
  db-data:

Drei Punkte sind hervorzuheben. Der Agenten-Port ist an 127.0.0.1 statt an 0.0.0.0 gebunden, weil ein öffentlicher Messaging-Webhook über einen Reverse-Proxy ankommen sollte, der TLS terminiert, und nicht direkt an einem rohen Container-Port. Geheimnisse liegen in einer .env-Datei neben der Compose-Datei (und niemals in git). Das Postgres-Volume ist benannt, damit docker compose es über Neustarts hinweg erhält; verlieren Sie dieses Volume, verlieren Sie das Gedächtnis Ihres Agenten.

Die 2026 erwähnenswerten Optionen

Hier ist die Kurzliste der Open-Source-Agenten-Stacks, die Docker-Images ausliefern und 2026 an Dynamik gewinnen.

Projekt Typ Lizenz Messaging-Integrationen Anmerkungen
Hermes Agent Laufzeit MIT Telegram, Slack, Discord, WhatsApp, Signal, E-Mail Persistenter Speicher, BYOK-Modellanbieter, autonome Skill-Erstellung
n8n Workflow Sustainable Use 400+ über Nodes Visueller Workflow-Builder, großer Integrationskatalog
Dify Workflow Apache 2.0 Web-Oberfläche, einbettbare Widgets RAG-First, Prompt-Orchestrierung, integriertes Monitoring
Flowise Workflow Apache 2.0 Web-Oberfläche, REST-/Slack-/Telegram-Nodes Drag-and-Drop-LangChain
LangGraph Framework MIT Was auch immer Sie verdrahten Code-First, tiefe Zustandsgraphen
AutoGen Framework CC-BY 4.0 (Microsoft) Was auch immer Sie verdrahten Multi-Agenten-Konversation
OpenHands Laufzeit MIT Web-Oberfläche, IDE Software-Engineering-Agent in einem isolierten Docker
Agent Zero Laufzeit MIT Web-Oberfläche, Terminal Autonomer Computer-Use-Agent

Die Aufteilung ist wichtig, weil die richtige Wahl davon abhängt, wofür Sie den Agenten einsetzen möchten. Eine Workflow-Plattform ist die richtige Wahl, wenn Sie einen Geschäftsprozess mit 14 Schritten und 5 externen APIs automatisieren möchten. Ein Framework ist die richtige Wahl, wenn Sie ein eigenes Produkt entwickeln. Eine Laufzeit ist die richtige Wahl, wenn Sie einen persönlichen Agenten möchten, der über eine Messaging-App auf Ihrem Telefon lebt und sich an Sie erinnert.

Für den Messaging-zentrierten persönlichen Anwendungsfall lässt sich Hermes Agent direkt mit n8n vergleichen für die Workflow-Seite und mit LangChain für die Framework-Seite.

Die echten Kompromisse

Selbsthosten in Docker ist nicht kostenlos, auch wenn die Binärdateien es sind. Die ehrliche Liste der Kompromisse für 2026:

Sie sind für die Verfügbarkeit verantwortlich. Ein verwalteter Agentenanbieter überwacht Prozesse, startet abgestürzte Container neu und ruft um 3 Uhr morgens jemanden an, wenn ein Release die Produktion lahmlegt. Auf einem selbst gehosteten VPS sind das Sie, selbst wenn Sie restart: unless-stopped konfiguriert haben. Docker startet Container neu; es repariert kein beschädigtes Postgres-Volume und kein abgelaufenes Telegram-Bot-Token.

Sie besitzen die Daten, vollständig. Das ist der Vorteil, der die Kompromisse für die meisten Leser lohnenswert macht. Ihre Konversationen, Ihre Kundennotizen, Ihre Kontaktliste, nichts davon berührt einen Dritten außer dem von Ihnen gewählten LLM-Anbieter. EU-Nutzer, die auf einem EU-VPS laufen, erhalten GDPR-Datenresidenz ohne Papierkram. Nutzer im Gesundheits- oder Buchhaltungswesen, die auf von ihnen kontrollierter Hardware laufen, erhalten eine belastbare Antwort auf die Frage „Wo liegen die Daten?".

Sie tragen die Modellkosten. Die Verwendung Ihres eigenen API-Schlüssels (BYOK) kostet für einen persönlichen Agenten in der Regel ein paar Dollar pro Monat statt der über $20, die ein gehostetes Äquivalent berechnet. Die Kehrseite ist, dass Sie ein OpenAI- oder Anthropic-Guthaben aufladen und im Auge behalten müssen.

Sie sind für das Upgrade verantwortlich. Ein neueres Image zu ziehen ist ein einziger Befehl, aber das Changelog zu lesen und das Datenbankschema zu migrieren ist es nicht. Planen Sie alle paar Monate ein 15-minütiges Zeitfenster ein.

Sie besitzen das LLM nicht. Sofern Sie nicht Ollama oder vLLM lokal auf einer GPU betreiben, ist das Modell selbst immer noch ein API-Aufruf an OpenAI, Anthropic, Google, Mistral oder ein OpenRouter-Aggregat. Selbst gehostet bedeutet 2026 in der Regel selbst gehostete Laufzeit, nicht selbst gehostete Gewichte. Das ist in Ordnung, denn die Laufzeit ist der Ort, an dem 90 % der Datensensibilität liegen.

Wenn diese Kompromisse für Sie akzeptabel klingen, ist der Vorteil bedeutsam. Selbst gehostete Infrastruktur zeigt über 18 Monate hinweg eine Reduzierung der Gesamtbetriebskosten von etwa 55 % gegenüber gleichwertigem SaaS, mit Latenzvorteilen in der Größenordnung von 18 ms, wenn das Modell ebenfalls lokal ist. Für die meisten Leser tritt der Kostenvorteil früher ein, etwa ab dem dritten Monat.

Wie das günstigste Setup aussieht

Eine praktische Basis für 2026 für einen selbst gehosteten Ein-Personen-Agenten:

  • Ein VPS für $5 bis $10 pro Monat (Hetzner, Vultr, Contabo) mit 2 GB RAM
  • Docker und Docker Compose installiert
  • Ein Reverse-Proxy (Caddy ist am einfachsten für automatisches TLS) auf Port 443
  • Ein Agenten-Laufzeit-Container, ein Postgres-Container
  • Ein Modell-API-Schlüssel, aufgeladen mit $5 bis $10
  • Ein Messaging-Bot (ein Telegram-Bot ist am schnellsten einzurichten)

Monatliche Gesamtrechnung: ungefähr $7 bis $20 je nach Nutzung, wovon $4 bis $10 auf API-Tokens entfallen und der Rest auf den VPS. Das Setup dauert 15 bis 30 Minuten, wenn Sie schon einmal Docker verwendet haben; eher einen Abend, wenn nicht. Die VPS-Dimensionierungsrechnung finden Sie in unserem speziellen Beitrag über günstiges VPS-Hosting für einen KI-Agenten, und die Kostenrechnung zwischen selbst gehostet und verwaltet finden Sie hier.

Ein aufgeräumter dunkler Arbeitsplatz bei Nacht mit einem Laptop, der Terminal-Ausgaben zeigt, und einem Telefon, das eine grüne Nachrichtenblase von einem selbst gehosteten KI-Agenten anzeigt

Wann Selbsthosten die falsche Antwort ist

Eine kurze Liste von Fällen, in denen der Docker-Weg das falsche Werkzeug ist.

  • Sie benötigen null Betriebsaufwand und Ihr Team toleriert keinerlei Ausfallzeiten. Zahlen Sie für eine verwaltete Laufzeit.
  • Sie wollen Anbieter-SLAs und eine Telefonnummer, die Sie anrufen können. Verwaltet.
  • Sie haben weniger als eine Stunde Geduld für die anfängliche Einrichtung. Verwaltet.
  • Ihr Agent muss morgen elastisch auf Tausende gleichzeitiger Nutzer skalieren. Eine verwaltete, Kubernetes-gestützte Laufzeit ist den Aufpreis wert.

Für alle anderen, Solo-Gründer, unabhängige Entwickler, kleine Firmen, datenschutzsensible Fachleute, Hobbyisten, ist Docker auf einem kleinen VPS der Weg mit dem besten Verhältnis von Kontrolle zu Einrichtungszeit.

Wo Hermes hineinpasst

Hermify ist eine MIT-lizenzierte, selbst gehostete KI-Agenten-Laufzeit, die als Docker-Image ausgeliefert wird. Sie bringen Ihren eigenen Modellanbieter-Schlüssel mit (OpenAI, Anthropic, OpenRouter, Mistral oder andere), Sie betreiben den Container auf einem VPS oder Ihrer eigenen Maschine, und Sie sprechen über Telegram, Slack, Discord, WhatsApp, Signal oder E-Mail mit ihm. Er behält persistenten Speicher über Konversationen hinweg, lernt wiederverwendbare Skills aus Ihrer Nutzung und hält sich die übrige Zeit aus Ihrem Weg. Er ist eine Option unter den oben aufgeführten Laufzeiten; er ist zufällig diejenige, die wir pflegen.

Wenn die Form des persönlichen Agenten auf Ihrem Telefon das ist, was Sie wollen, und Sie eine Stunde Zeit haben, um einen Docker-Container hinter einen Reverse-Proxy zu setzen, legen Sie mit Hermify los. Wenn Sie den VPS lieber ganz überspringen und ihn von uns betreiben lassen möchten, kümmert sich die verwaltete Stufe um den Container, Postgres, TLS und die Updates, während Sie Ihren eigenen Modellschlüssel behalten.

Quellen

Betreiben Sie Ihren eigenen Hermes Agent

Bringen Sie Ihren API-Schlüssel mit, verbinden Sie Telegram und erhalten Sie in 60 Sekunden einen selbstlernenden KI-Agenten.

Loslegen