Selbst gehosteter KI-Assistent für Slack: Optionen für 2026
So betreiben Sie einen selbst gehosteten KI-Assistenten direkt in Slack, ohne Kanalinhalte an ein fremdes SaaS weiterzuleiten. Die Optionen für 2026, die tatsächlich funktionieren.

Warum Sie überhaupt danach suchen
Sie haben in Slack bereits eine KI-Option. Slack AI ist in den kostenpflichtigen Tarifen integriert, und Salesforce drängt Agentforce weiterhin in die Kanal-Seitenleiste als Standard-Agentenoberfläche für Enterprise Grid. Beide funktionieren, beide sind bequem, und beide haben dieselbe unumstößliche Eigenschaft: Jede Nachricht, die der Agent liest, durchläuft die Inferenz-Pipeline eines anderen, und das Gedächtnis des Agenten über Ihr Team liegt in der Datenbank eines Anbieters, die Sie nicht einsehen können.
Für viele Teams ist das ein akzeptabler Kompromiss. Für die übrigen, also regulierte Branchen, Agenturen, die Kundendaten unter Geheimhaltungsvereinbarung verarbeiten, Gründer, die nicht möchten, dass ein Dritter Strategie-Threads indexiert, oder EU-Teams, die sich um die Risiken durch den US CLOUD Act sorgen, muss die Antwort anders ausfallen. Sie möchten die Chat-Oberfläche von Slack, aber Sie möchten, dass der KI-Teil auf einer Infrastruktur läuft, die Sie kontrollieren, mit Geheimnissen, die Ihnen gehören, und ohne dass ein Dritter dazwischensitzt.
Dieser Beitrag erklärt, was „selbst gehosteter KI-Assistent für Slack" im Jahr 2026 tatsächlich bedeutet, welche Open-Source-Optionen heute einen Slack-Adapter mitbringen, welche Architekturentscheidungen Sie nicht umgehen können und wo jede Option an ihre Grenzen stößt.
Was Sie nicht selbst hosten können: Slack selbst
Die erste Klarstellung ist unbequem. Slack ist nicht selbst hostbar. Es läuft ausschließlich in der Cloud von Salesforce, und selbst Enterprise Grid mit International Data Residency lässt Sie nur eine geografische Region für die Speicherung auswählen. Sie können Slack nicht auf Ihrem eigenen Server installieren, und Sie kontrollieren die Verschlüsselungsschlüssel nicht.
Was Sie selbst hosten können, ist der Agent am anderen Ende der Slack-API. Die Nachricht erreicht weiterhin die Server von Slack, das ist unvermeidlich, solange Sie Slack als Chat-Oberfläche nutzen. Aber in dem Moment, in dem Slack sie an Ihren Bot übergibt, entscheiden Sie, wohin sie als Nächstes geht: welcher LLM-Anbieter sie sieht, welche Datenbank die Konversation speichert, welcher Vektorspeicher sich im nächsten Monat daran erinnert. Das ist die Grenze, die Sie tatsächlich ziehen.
Wenn Sie möchten, dass die Chat-Plattform selbst auf Ihren Servern läuft, dann geht es um einen Slack-Ersatz (Mattermost, Rocket.Chat, Zulip) und nicht um einen selbst gehosteten Slack-Bot. Die meisten Teams behalten Slack und hosten nur den Agenten selbst.

Was Ihnen Self-Hosting bringt
Drei konkrete Dinge, und es lohnt sich, ehrlich zu sein, welches davon Ihnen tatsächlich wichtig ist, bevor Sie sich für einen Stack entscheiden.
Datenkontrolle darüber, was den Workspace verlässt. Ein selbst gehosteter Bot liest ein Slack-Ereignis, entscheidet, welcher Kontext an das LLM weitergeleitet wird, und Sie haben diese Entscheidungslogik geschrieben. Sie können Benutzernamen entfernen, Regex-Muster schwärzen, nur bestimmte Kanäle an ein externes Modell leiten und andere auf einem lokalen Modell belassen.
Ihre eigene Modellrechnung, kein KI-Tarif pro Sitzplatz. Slack AI wird pro Benutzer berechnet. Agentforce wird pro Konversation berechnet. Ein selbst gehosteter Bot mit einem BYOK-Setup zahlt direkt an den Modellanbieter, in der Regel ein paar Cent pro aktivem Benutzer und Tag zu marktüblichen API-Preisen.
Ein dauerhaftes Gedächtnis, das Sie prüfen können. Gehostetes KI-Gedächtnis ist undurchsichtig. Ein selbst gehosteter Agent speichert sein Gedächtnis in einer Postgres- oder SQLite-Datenbank, die Ihnen gehört. Sie können es lesen, exportieren, löschen und sichern.
Was Ihnen Self-Hosting nicht bringt: geringere Betriebskosten im ersten Monat. Sie werden einen Abend damit verbringen, den Bot einzurichten, und Sie sind für Neustarts, Modell-Upgrades und die gelegentliche Migration von Slack-Berechtigungen verantwortlich. Die Einsparungen zeigen sich im dritten Monat, nicht in der ersten Woche.
Die Open-Source-Optionen, die 2026 tatsächlich einen Slack-Adapter mitbringen
Die meisten „KI-Bot für Slack"-Projekte auf GitHub entpuppen sich als dünne Wrapper um die OpenAI-API ohne Gedächtnis, ohne Werkzeugnutzung und ohne dauerhaft laufende Laufzeitumgebung. Die folgende Liste ist auf Projekte gefiltert, die tatsächlich einen Slack-Adapter mitbringen, eine Gedächtnisschicht haben und 2026 gepflegt werden.
| Projekt | Form | Slack-Modus | Stärken | Schwächen |
|---|---|---|---|---|
| OpenClaw | Dauerhaft laufende persönliche Agenten-Laufzeitumgebung, 200.000+ Stars | Socket Mode, 24+ Kanäle | Mehrkanal-Breite (Telegram + WhatsApp + Slack + Signal + iMessage in einem Daemon) | Auf persönliche Konten ausgerichtet; die Team-Workspace-Ergonomie ist rudimentär |
| Hermes Agent | Headless-Agent mit Gedächtnis und Skills, läuft als Dienst | Socket Mode über offiziellen Adapter | Allowlist pro Benutzer, geplante Aufgaben, eigene Skills, MCP-Unterstützung | Sie verwalten die VPS selbst, sofern Sie kein verwaltetes Hosting nutzen |
| Archer (SlackAgent) | Slack-orientierter Agent auf Basis von Arcade + LangGraph | Von Zeile 1 an für Slack gebaut | Native Slack-UX (Slash-Befehle, flüchtige Vorschauen), Google-/GitHub-/Such-Integrationen | Nur Slack; kein Telegram- oder WhatsApp-Rückfall |
| Moltworker | Selbst gehosteter persönlicher Agent, läuft auf Cloudflare Workers | Webhook | Edge-Laufzeitmodell, keine VPS, um die man sich kümmern muss | Einschränkungen der Worker-Laufzeit, kleinere Community |
| Open Source Slack AI | Hilfsmittel mit Funktionsparität zu Slack AI (Thread- und Kanal-Zusammenfassungen) | App | Ersetzt unmittelbar die Premium-Zusammenfassungsfunktionen von Slack AI | Kein vollständiger Agent, nur Zusammenfassungswerkzeuge, keine agentischen Aktionen |
| Mattermost + eigener Bot | Open-Source-Slack-Alternative mit Bot-Framework | Nativ | Vollständige Chat-Plattform + Bot in einem selbst gehosteten Stack | Sie ersetzen damit auch Slack als Chat-Client, was eine deutlich größere Migration ist |
Die ehrliche Zusammenfassung: Wenn Sie Slack behalten und einen echten Agenten möchten (Gedächtnis, Werkzeuge, geplante Aufgaben, mehrstufiges Denken), ist die realistische Auswahlliste für 2026 OpenClaw, Hermes Agent oder Archer. Der Rest sind entweder Werkzeuge für einen einzigen Zweck oder vollständige Slack-Ersätze.
Socket Mode macht Self-Hosting schmerzlos
Jede der oben genannten Optionen außer Moltworker nutzt den Socket Mode von Slack. Zu verstehen, warum, ist wichtig, bevor Sie sich für einen Stack entscheiden.
Eine herkömmliche Slack-App nutzt die Events-API: Slack sendet einen HTTPS-POST an eine öffentliche URL, die Sie kontrollieren, sobald etwas passiert. Das selbst zu hosten bedeutet, einen öffentlichen HTTPS-Endpunkt mit einem gültigen TLS-Zertifikat bereitzustellen, was eine Domain, einen Reverse-Proxy, ein TLS-Zertifikat mit automatischer Erneuerung und einen offenen eingehenden Port in der Firewall erfordert. Für einen privaten Mac oder einen kleinen Büroserver ist das in der Regel der Teil, der das Projekt zum Scheitern bringt.
Der Socket Mode dreht die Richtung um. Ihr Bot öffnet eine ausgehende WebSocket-Verbindung zu Slack und hält sie offen. Jedes Ereignis trifft über diese eine Verbindung ein. Keine öffentliche URL, kein eingehender Port, kein TLS zu verwalten. Der Bot kann auf Ihrem Laptop, auf einer 5-$-VPS oder hinter einer Unternehmens-Firewall laufen, und er empfängt Nachrichten auf genau dieselbe Weise.
Der Kompromiss besteht darin, dass Socket-Mode-Verbindungen abbrechen. Die Slack-Dokumentation ist dabei eindeutig: Bei größerer Last verbindet sich die WebSocket-Verbindung neu, und jedes Ereignis, das während der Lücke auftritt, geht verloren, denn Slack spielt es nicht erneut ab. Jeder produktionsreife selbst gehostete Agent benötigt eine Wiederverbindungslogik und einen idempotenten Nachrichten-Handler, was die oben genannten gepflegten Projekte bereits mitbringen.
Die Härtungs-Checkliste, die niemand erwähnt, bis sie zum Verhängnis wird
Die fünf Dinge, die Sie absichern sollten, bevor Sie einen selbst gehosteten Bot etwas Sensibles lesen lassen:
Eine numerische Allowlist. Jeder ernstzunehmende Slack-Agent unterstützt eine Umgebungsvariable SLACK_ALLOWED_USERS (oder ein Äquivalent). Sie erwartet die numerischen Benutzer-IDs von Slack (U01ABC234), nicht die Handles. Ohne sie muss die sichere Voreinstellung Deny-all sein, denn ein Bot, der in einen öffentlichen Kanal eingeladen wird, würde sonst jedem antworten. Ihre ID erhalten Sie über das Drei-Punkte-Menü Ihres Slack-Profils unter „Mitglieds-ID kopieren".
Eingeschränkte Tokens, keine Benutzer-Tokens. Verwenden Sie ein Bot-Token (xoxb-…) mit den minimal erforderlichen Berechtigungen, typischerweise app_mentions:read, chat:write, im:history, im:write, users:read. Vermeiden Sie Benutzer-Tokens (xoxp-…) vollständig; sie gewähren dem Bot Zugriff auf Ihr gesamtes Konto, was einen weitaus größeren Schadensradius bedeutet, falls der Host kompromittiert wird.
Geheimnisse außerhalb von Git. Jedes Token (Slack-Bot-Token, App-Level-Token, Modellanbieter-Schlüssel) gehört in eine .env-Datei, die per gitignore ausgeschlossen ist, oder in einen Secrets-Manager. Öffentliche GitHub-Repositories mit einem geleakten xoxb--Token werden innerhalb von Minuten ausgenutzt.
Ein Reverse-Proxy für jeden Webhook-Pfad. Wenn Sie den Socket Mode nicht verwenden, benötigt Ihr Bot einen öffentlichen HTTPS-Endpunkt. Setzen Sie Caddy oder Traefik davor für die TLS-Terminierung und die Ratenbegrenzung. Binden Sie den Agenten niemals direkt an einen öffentlichen Port.
Ein Modellanbieter, dem Sie vertrauen. Das Self-Hosting des Agenten nützt nichts, wenn Sie anschließend jede Slack-Nachricht an einen LLM-Anbieter mit schwachen Datenschutzgarantien senden. Wählen Sie einen Anbieter mit einer No-Training-Klausel, oder betreiben Sie das Modell lokal (Ollama auf einer Workstation mit ausreichend VRAM) für die sensibelsten Kanäle.
Eine ausführlichere Erläuterung dieser Kompromisse finden Sie im Docker-Leitfaden zum selbst gehosteten KI-Agenten, der das beliebteste Substrat für jede der oben genannten Laufzeitumgebungen ist.
Wo Hermes Agent passt und wann Hermify sinnvoll ist
Hermes Agent ist die Option, die dem am nächsten kommt, was die meisten Teams, die nach dieser Anfrage suchen, möchten: eine einzige Headless-Laufzeitumgebung, Slack-Unterstützung über Socket Mode von Haus aus, Allowlist nach numerischer ID, dauerhaftes Gedächtnis in einer Datenbank, die Sie kontrollieren, eigene Skills, geplante Aufgaben und ein Docker-Image, das auf jeder 5-$-VPS läuft. Die schrittweise Slack-Installation ist in So richten Sie Hermes Agent auf Slack ein dokumentiert, etwa zehn Minuten, wenn die Laufzeitumgebung bereits läuft.

Die ehrliche Einordnung von Hermify: Wir haben es für die zweite Hälfte des Self-Hostings gebaut, vor der die README nie warnt. Die Laufzeitumgebung auszuwählen ist der einfache Tag. Die VPS gepatcht zu halten, Slack-Tokens zu rotieren, den Zwischenfall eines Modellanbieters zu überstehen, den Container nach einem Hermes-Update neu zu bauen und dem Bot zuzusehen, wie er sich nach einem Slack-Ausfall sauber wieder verbindet, ist der Teil, der Abende verschlingt. Hermify übernimmt diese Betriebsschicht für Sie und gibt Ihnen auf der Modellseite weiterhin BYOK, also dieselbe Datengrenze, weniger Infrastruktur-Geklöppel. Wenn Sie lieber den gesamten Stack von der VPS aufwärts selbst besitzen möchten, legt die Preisaufschlüsselung selbst gehostet vs. verwaltet die echten Zahlen offen, damit Sie auf der Grundlage von Substanz und nicht von Bauchgefühl entscheiden können.
Wenn Sie bereit sind, die Infrastruktur-Abende zu überspringen, legen Sie mit Hermify los, und Sie haben in unter fünf Minuten einen Hermes Agent bereit, um ihn in Slack einzubinden. Wenn Sie es lieber selbst machen möchten, sind die oben genannten Open-Source-Optionen real und Ihre Zeit wert. Beide Wege halten Ihre Slack-Inhalte aus der Inferenz-Pipeline eines anderen heraus, und genau darum geht es eigentlich.
Quellen
Betreiben Sie Ihren eigenen Hermes Agent
Bringen Sie Ihren API-Schlüssel mit, verbinden Sie Telegram und erhalten Sie in 60 Sekunden einen selbstlernenden KI-Agenten.
Loslegen