Selbst gehosteter KI-Assistent für Slack: Optionen für 2026

Warum Sie überhaupt danach suchen

Sie haben in Slack bereits eine KI-Option. Slack AI ist in den kostenpflichtigen Tarifen integriert, und Salesforce drängt Agentforce weiterhin in die Kanal-Seitenleiste als Standard-Agentenoberfläche für Enterprise Grid. Beide funktionieren, beide sind bequem, und beide haben dieselbe unumstößliche Eigenschaft: Jede Nachricht, die der Agent liest, durchläuft die Inferenz-Pipeline eines anderen, und das Gedächtnis des Agenten über Ihr Team liegt in der Datenbank eines Anbieters, die Sie nicht einsehen können.

Für viele Teams ist das ein akzeptabler Kompromiss. Für die übrigen, also regulierte Branchen, Agenturen, die Kundendaten unter Geheimhaltungsvereinbarung verarbeiten, Gründer, die nicht möchten, dass ein Dritter Strategie-Threads indexiert, oder EU-Teams, die sich um die Risiken durch den US CLOUD Act sorgen, muss die Antwort anders ausfallen. Sie möchten die Chat-Oberfläche von Slack, aber Sie möchten, dass der KI-Teil auf einer Infrastruktur läuft, die Sie kontrollieren, mit Geheimnissen, die Ihnen gehören, und ohne dass ein Dritter dazwischensitzt.

Dieser Beitrag erklärt, was „selbst gehosteter KI-Assistent für Slack" im Jahr 2026 tatsächlich bedeutet, welche Open-Source-Optionen heute einen Slack-Adapter mitbringen, welche Architekturentscheidungen Sie nicht umgehen können und wo jede Option an ihre Grenzen stößt.

Was Sie nicht selbst hosten können: Slack selbst

Die erste Klarstellung ist unbequem. Slack ist nicht selbst hostbar. Es läuft ausschließlich in der Cloud von Salesforce, und selbst Enterprise Grid mit International Data Residency lässt Sie nur eine geografische Region für die Speicherung auswählen. Sie können Slack nicht auf Ihrem eigenen Server installieren, und Sie kontrollieren die Verschlüsselungsschlüssel nicht.

Was Sie selbst hosten können, ist der Agent am anderen Ende der Slack-API. Die Nachricht erreicht weiterhin die Server von Slack, das ist unvermeidlich, solange Sie Slack als Chat-Oberfläche nutzen. Aber in dem Moment, in dem Slack sie an Ihren Bot übergibt, entscheiden Sie, wohin sie als Nächstes geht: welcher LLM-Anbieter sie sieht, welche Datenbank die Konversation speichert, welcher Vektorspeicher sich im nächsten Monat daran erinnert. Das ist die Grenze, die Sie tatsächlich ziehen.

Wenn Sie möchten, dass die Chat-Plattform selbst auf Ihren Servern läuft, dann geht es um einen Slack-Ersatz (Mattermost, Rocket.Chat, Zulip) und nicht um einen selbst gehosteten Slack-Bot. Die meisten Teams behalten Slack und hosten nur den Agenten selbst.

Eine schematische Darstellung mit einem Slack-Kanal links und einer selbst gehosteten Agenten-Laufzeitumgebung rechts, verbunden durch einen einzelnen mit Socket Mode beschrifteten Pfeil

Was Ihnen Self-Hosting bringt

Drei konkrete Dinge, und es lohnt sich, ehrlich zu sein, welches davon Ihnen tatsächlich wichtig ist, bevor Sie sich für einen Stack entscheiden.

Datenkontrolle darüber, was den Workspace verlässt. Ein selbst gehosteter Bot liest ein Slack-Ereignis, entscheidet, welcher Kontext an das LLM weitergeleitet wird, und Sie haben diese Entscheidungslogik geschrieben. Sie können Benutzernamen entfernen, Regex-Muster schwärzen, nur bestimmte Kanäle an ein externes Modell leiten und andere auf einem lokalen Modell belassen.

Ihre eigene Modellrechnung, kein KI-Tarif pro Sitzplatz. Slack AI wird pro Benutzer berechnet. Agentforce wird pro Konversation berechnet. Ein selbst gehosteter Bot mit einem BYOK-Setup zahlt direkt an den Modellanbieter, in der Regel ein paar Cent pro aktivem Benutzer und Tag zu marktüblichen API-Preisen.

Ein dauerhaftes Gedächtnis, das Sie prüfen können. Gehostetes KI-Gedächtnis ist undurchsichtig. Ein selbst gehosteter Agent speichert sein Gedächtnis in einer Postgres- oder SQLite-Datenbank, die Ihnen gehört. Sie können es lesen, exportieren, löschen und sichern.

Was Ihnen Self-Hosting nicht bringt: geringere Betriebskosten im ersten Monat. Sie werden einen Abend damit verbringen, den Bot einzurichten, und Sie sind für Neustarts, Modell-Upgrades und die gelegentliche Migration von Slack-Berechtigungen verantwortlich. Die Einsparungen zeigen sich im dritten Monat, nicht in der ersten Woche.

Die Open-Source-Optionen, die 2026 tatsächlich einen Slack-Adapter mitbringen

Die meisten „KI-Bot für Slack"-Projekte auf GitHub entpuppen sich als dünne Wrapper um die OpenAI-API ohne Gedächtnis, ohne Werkzeugnutzung und ohne dauerhaft laufende Laufzeitumgebung. Die folgende Liste ist auf Projekte gefiltert, die tatsächlich einen Slack-Adapter mitbringen, eine Gedächtnisschicht haben und 2026 gepflegt werden.

Projekt	Form	Slack-Modus	Stärken	Schwächen
OpenClaw	Dauerhaft laufende persönliche Agenten-Laufzeitumgebung, 200.000+ Stars	Socket Mode, 24+ Kanäle	Mehrkanal-Breite (Telegram + WhatsApp + Slack + Signal + iMessage in einem Daemon)	Auf persönliche Konten ausgerichtet; die Team-Workspace-Ergonomie ist rudimentär
Hermes Agent	Headless-Agent mit Gedächtnis und Skills, läuft als Dienst	Socket Mode über offiziellen Adapter	Allowlist pro Benutzer, geplante Aufgaben, eigene Skills, MCP-Unterstützung	Sie verwalten die VPS selbst, sofern Sie kein verwaltetes Hosting nutzen
Archer (SlackAgent)	Slack-orientierter Agent auf Basis von Arcade + LangGraph	Von Zeile 1 an für Slack gebaut	Native Slack-UX (Slash-Befehle, flüchtige Vorschauen), Google-/GitHub-/Such-Integrationen	Nur Slack; kein Telegram- oder WhatsApp-Rückfall
Moltworker	Selbst gehosteter persönlicher Agent, läuft auf Cloudflare Workers	Webhook	Edge-Laufzeitmodell, keine VPS, um die man sich kümmern muss	Einschränkungen der Worker-Laufzeit, kleinere Community
Open Source Slack AI	Hilfsmittel mit Funktionsparität zu Slack AI (Thread- und Kanal-Zusammenfassungen)	App	Ersetzt unmittelbar die Premium-Zusammenfassungsfunktionen von Slack AI	Kein vollständiger Agent, nur Zusammenfassungswerkzeuge, keine agentischen Aktionen
Mattermost + eigener Bot	Open-Source-Slack-Alternative mit Bot-Framework	Nativ	Vollständige Chat-Plattform + Bot in einem selbst gehosteten Stack	Sie ersetzen damit auch Slack als Chat-Client, was eine deutlich größere Migration ist

Die ehrliche Zusammenfassung: Wenn Sie Slack behalten und einen echten Agenten möchten (Gedächtnis, Werkzeuge, geplante Aufgaben, mehrstufiges Denken), ist die realistische Auswahlliste für 2026 OpenClaw, Hermes Agent oder Archer. Der Rest sind entweder Werkzeuge für einen einzigen Zweck oder vollständige Slack-Ersätze.

Socket Mode macht Self-Hosting schmerzlos

Jede der oben genannten Optionen außer Moltworker nutzt den Socket Mode von Slack. Zu verstehen, warum, ist wichtig, bevor Sie sich für einen Stack entscheiden.

Eine herkömmliche Slack-App nutzt die Events-API: Slack sendet einen HTTPS-POST an eine öffentliche URL, die Sie kontrollieren, sobald etwas passiert. Das selbst zu hosten bedeutet, einen öffentlichen HTTPS-Endpunkt mit einem gültigen TLS-Zertifikat bereitzustellen, was eine Domain, einen Reverse-Proxy, ein TLS-Zertifikat mit automatischer Erneuerung und einen offenen eingehenden Port in der Firewall erfordert. Für einen privaten Mac oder einen kleinen Büroserver ist das in der Regel der Teil, der das Projekt zum Scheitern bringt.

Der Socket Mode dreht die Richtung um. Ihr Bot öffnet eine ausgehende WebSocket-Verbindung zu Slack und hält sie offen. Jedes Ereignis trifft über diese eine Verbindung ein. Keine öffentliche URL, kein eingehender Port, kein TLS zu verwalten. Der Bot kann auf Ihrem Laptop, auf einer 5-$-VPS oder hinter einer Unternehmens-Firewall laufen, und er empfängt Nachrichten auf genau dieselbe Weise.

Der Kompromiss besteht darin, dass Socket-Mode-Verbindungen abbrechen. Die Slack-Dokumentation ist dabei eindeutig: Bei größerer Last verbindet sich die WebSocket-Verbindung neu, und jedes Ereignis, das während der Lücke auftritt, geht verloren, denn Slack spielt es nicht erneut ab. Jeder produktionsreife selbst gehostete Agent benötigt eine Wiederverbindungslogik und einen idempotenten Nachrichten-Handler, was die oben genannten gepflegten Projekte bereits mitbringen.

Die Härtungs-Checkliste, die niemand erwähnt, bis sie zum Verhängnis wird

Die fünf Dinge, die Sie absichern sollten, bevor Sie einen selbst gehosteten Bot etwas Sensibles lesen lassen:

Eine numerische Allowlist. Jeder ernstzunehmende Slack-Agent unterstützt eine Umgebungsvariable SLACK_ALLOWED_USERS (oder ein Äquivalent). Sie erwartet die numerischen Benutzer-IDs von Slack (U01ABC234), nicht die Handles. Ohne sie muss die sichere Voreinstellung Deny-all sein, denn ein Bot, der in einen öffentlichen Kanal eingeladen wird, würde sonst jedem antworten. Ihre ID erhalten Sie über das Drei-Punkte-Menü Ihres Slack-Profils unter „Mitglieds-ID kopieren".

Eingeschränkte Tokens, keine Benutzer-Tokens. Verwenden Sie ein Bot-Token (xoxb-…) mit den minimal erforderlichen Berechtigungen, typischerweise app_mentions:read, chat:write, im:history, im:write, users:read. Vermeiden Sie Benutzer-Tokens (xoxp-…) vollständig; sie gewähren dem Bot Zugriff auf Ihr gesamtes Konto, was einen weitaus größeren Schadensradius bedeutet, falls der Host kompromittiert wird.

Geheimnisse außerhalb von Git. Jedes Token (Slack-Bot-Token, App-Level-Token, Modellanbieter-Schlüssel) gehört in eine .env-Datei, die per gitignore ausgeschlossen ist, oder in einen Secrets-Manager. Öffentliche GitHub-Repositories mit einem geleakten xoxb--Token werden innerhalb von Minuten ausgenutzt.

Ein Reverse-Proxy für jeden Webhook-Pfad. Wenn Sie den Socket Mode nicht verwenden, benötigt Ihr Bot einen öffentlichen HTTPS-Endpunkt. Setzen Sie Caddy oder Traefik davor für die TLS-Terminierung und die Ratenbegrenzung. Binden Sie den Agenten niemals direkt an einen öffentlichen Port.

Ein Modellanbieter, dem Sie vertrauen. Das Self-Hosting des Agenten nützt nichts, wenn Sie anschließend jede Slack-Nachricht an einen LLM-Anbieter mit schwachen Datenschutzgarantien senden. Wählen Sie einen Anbieter mit einer No-Training-Klausel, oder betreiben Sie das Modell lokal (Ollama auf einer Workstation mit ausreichend VRAM) für die sensibelsten Kanäle.

Eine ausführlichere Erläuterung dieser Kompromisse finden Sie im Docker-Leitfaden zum selbst gehosteten KI-Agenten, der das beliebteste Substrat für jede der oben genannten Laufzeitumgebungen ist.

Wo Hermes Agent passt und wann Hermify sinnvoll ist

Hermes Agent ist die Option, die dem am nächsten kommt, was die meisten Teams, die nach dieser Anfrage suchen, möchten: eine einzige Headless-Laufzeitumgebung, Slack-Unterstützung über Socket Mode von Haus aus, Allowlist nach numerischer ID, dauerhaftes Gedächtnis in einer Datenbank, die Sie kontrollieren, eigene Skills, geplante Aufgaben und ein Docker-Image, das auf jeder 5-$-VPS läuft. Die schrittweise Slack-Installation ist in So richten Sie Hermes Agent auf Slack ein dokumentiert, etwa zehn Minuten, wenn die Laufzeitumgebung bereits läuft.

Ein dunkles VPS-Terminal mit der Ausgabe von docker compose ps, das einen hermes-agent-Container in einem fehlerfreien Zustand und einen kleinen grünen Statuspunkt zeigt

Die ehrliche Einordnung von Hermify: Wir haben es für die zweite Hälfte des Self-Hostings gebaut, vor der die README nie warnt. Die Laufzeitumgebung auszuwählen ist der einfache Tag. Die VPS gepatcht zu halten, Slack-Tokens zu rotieren, den Zwischenfall eines Modellanbieters zu überstehen, den Container nach einem Hermes-Update neu zu bauen und dem Bot zuzusehen, wie er sich nach einem Slack-Ausfall sauber wieder verbindet, ist der Teil, der Abende verschlingt. Hermify übernimmt diese Betriebsschicht für Sie und gibt Ihnen auf der Modellseite weiterhin BYOK, also dieselbe Datengrenze, weniger Infrastruktur-Geklöppel. Wenn Sie lieber den gesamten Stack von der VPS aufwärts selbst besitzen möchten, legt die Preisaufschlüsselung selbst gehostet vs. verwaltet die echten Zahlen offen, damit Sie auf der Grundlage von Substanz und nicht von Bauchgefühl entscheiden können.

Wenn Sie bereit sind, die Infrastruktur-Abende zu überspringen, legen Sie mit Hermify los, und Sie haben in unter fünf Minuten einen Hermes Agent bereit, um ihn in Slack einzubinden. Wenn Sie es lieber selbst machen möchten, sind die oben genannten Open-Source-Optionen real und Ihre Zeit wert. Beide Wege halten Ihre Slack-Inhalte aus der Inferenz-Pipeline eines anderen heraus, und genau darum geht es eigentlich.