self-hosted-chatgpt-alternative

title: "支持任意模型的 AI 智能体:ChatGPT、Claude 或你自己的模型,随心选用" description: "Hermes Agent 与模型无关:将 ChatGPT、Claude、Gemini 或任意本地模型作为其大脑接入。获得一个具备持久化记忆、工具调用和定时执行能力的智能体,而不仅仅是一个聊天界面。" date: 2026-06-17 author: "Hermify Team" tags: ["ChatGPT", "Claude", "AI Agents", "Model Agnostic", "Self-Hosted"] coverImage: "cover.jpg" coverAlt: "深色背景示意图:多个 AI 模型节点环绕中央绿色智能体枢纽,叠加简洁无衬线字体文字"任意模型。一个智能体。""
被锁定在单一模型的困境
大多数人搜索"自托管 ChatGPT 替代方案"时,其实把两个问题混在了一起:模型在哪里运行,以及模型究竟能为他们做什么。
Open WebUI、LibreChat 和 AnythingLLM 解决的是第一个问题。它们是位于模型前端的聊天界面,为你提供可自托管的 ChatGPT 风格交互。它们在各自的定位上做得非常出色。
但它们都共享同一个根本性的局限:它们等待你来输入。
没人会直接提问、但最终人人都想知道答案的问题是:"我能拥有一个使用 ChatGPT、或 Claude、或 Gemini、或本地 Llama,并且真正能自主完成工作的助手吗?"
可以。这正是 Hermes Agent 所做的事。

与模型无关:真正的优势所在
Hermes Agent 不在乎你使用哪个模型。它的职责是成为一个具备持久化记忆、工具调用和定时执行能力的智能体。AI 模型是可插拔的:把它想象成你选择的"大脑",而 Hermes 则是负责记忆、行动、按计划运行的"身体"。
在实践中,你可以将 Hermes 连接到:
- ChatGPT(GPT-4o / GPT-4.1) — 通过你自己的 OpenAI API 密钥
- Claude(Sonnet 或 Opus) — 通过你的 Anthropic 密钥
- Gemini — 通过 Google 的 API
- 任意本地模型(Llama、Mistral、Qwen)— 通过 Ollama 或任何兼容 OpenAI 的端点
- OpenRouter — 用一个密钥跨数十个服务商进行路由
你甚至可以在不改变其他任何设置的情况下切换模型。如果你今天用 GPT-4o 作为默认大脑,明天想换成 Claude,只需更新一个设置。记忆、工具连接、定时技能——全部保留。
这比听起来更重要。AI 模型迭代飞快。能够在不重建智能体的前提下替换大脑,不是锦上添花,而是确保在六个月后更好的模型发布时你不会被锁定的关键。
Hermes 在任意模型之上额外提供的能力
聊天界面把你的消息发给模型,然后展示回复。这就是全部功能。
Hermes 增加了任何聊天前端都无法提供的三个层次:
1. 跨会话的持久化记忆。 Hermes 记得你上周二谈过什么。它可以在今天的对话中使用那些上下文,而无需你重新粘贴。
2. 自主发起的工具调用。 Hermes 可以读取你的邮件收件箱、查询数据库、发消息到 Telegram、检查 Stripe,或调用任意 API——无需你开口,按你定义的计划自动执行。
3. 定时执行。 你的智能体在早上 7 点运行并发送摘要给你;在 Stripe 事件触发后运行并通知你;每小时检查一次控制台,仅在发生变化时才推送提醒。所有这些都不需要你打开聊天窗口。
你接入的模型负责推理和语言理解。Hermes 负责其他一切。

用你选择的模型运行 Hermes 的三种方式
Hermify 提供三个档位,均围绕与模型无关的理念构建:
Starter(BYOK)— $19/月。 自带 API 密钥:OpenAI、Anthropic、OpenRouter 或任何兼容端点。你直接向模型服务商付费。Hermify 负责智能体基础设施、记忆存储、VPS 和在线运行。适合已有偏好模型、希望自主管理账单的用户。
Pro — $29/月。 Hermify 提供托管密钥。无需单独的 API 账户即可使用当前顶级模型。账单更简洁,无需管理 API 密钥,模型升级由我们处理。
Dedicated — $49/月。 专用 VPS、隔离环境,以及对模型路由的完全控制。适合需要数据隔离、或希望将私有本地模型与云端 API 混合使用的团队。
三个档位提供相同的智能体:持久化记忆、工具调用、定时技能、MCP 服务器支持。唯一的区别是谁来管理模型密钥和硬件。
如果你还想保留聊天界面
Hermes 的输入端支持兼容 OpenAI 的 API。这意味着如果你已经部署了 Open WebUI,可以将其指向你的 Hermes 实例,通过你熟悉的界面继续聊天。
鱼和熊掌兼得:想打字时用熟悉的聊天窗口,不需要时让智能体在后台自主运行。
区别在于,现在模型不再锁定于单一服务商,智能体记得你上周说过什么,而且它可以在无需被动等待的情况下主动完成任务。
接下来怎么做
如果你想先用本地模型试验,安装 Ollama 并将 Hermes 指向它即可。之后切换到云端模型时,其他任何设置都无需改动。
如果你想跳过基础设施搭建、直接使用智能体,Hermify 的配置不超过 5 分钟。
模型由你选择。智能体就是 Hermes。