Agente IA con cualquier modelo: usa ChatGPT, Claude o el tuyo
Hermes Agent es agnóstico al modelo: conecta ChatGPT, Claude, Gemini o cualquier modelo local como cerebro. Un agente persistente con memoria, herramientas y programación, no solo una UI de chat.

El problema de estar atado a un solo modelo
Cuando la mayoría de la gente busca "alternativa a ChatGPT autoalojada", en realidad tiene dos preguntas mezcladas en una: dónde corre el modelo y qué puede hacer ese modelo por ellos.
Open WebUI, LibreChat y AnythingLLM resuelven la primera parte. Son front-ends de chat que se colocan delante de un modelo y te dan una interfaz estilo ChatGPT que alojas tú mismo. Son excelentes en lo que hacen.
Pero todos comparten la misma limitación fundamental: esperan a que escribas.
La pregunta que nadie hace pero que todo el mundo acaba queriendo responder es: "¿Puedo tener un asistente que use ChatGPT, o Claude, o Gemini, o un Llama local, y que trabaje de verdad por su cuenta?"
Sí. Eso es exactamente lo que hace Hermes Agent.

Agnóstico al modelo: la ventaja real
Hermes Agent no le importa qué modelo uses. Su trabajo es ser un agente persistente con memoria, llamada a herramientas y ejecución programada. El modelo de IA es enchufable: piénsalo como el "cerebro" que eliges, mientras Hermes es el cuerpo que recuerda, actúa y corre según un calendario.
En la práctica, puedes conectar Hermes a:
- ChatGPT (GPT-4o / GPT-4.1) con tu propia clave de OpenAI
- Claude (Sonnet u Opus) con tu clave de Anthropic
- Gemini a través de la API de Google
- Cualquier modelo local (Llama, Mistral, Qwen) vía Ollama o cualquier endpoint compatible con OpenAI
- OpenRouter para enrutar entre decenas de proveedores con una sola clave
Incluso puedes cambiar de modelo sin tocar nada más. Si hoy corres GPT-4o como cerebro por defecto y mañana quieres pasarte a Claude, actualizas un ajuste. La memoria, las conexiones a herramientas, las skills programadas: todo se mantiene.
Esto importa más de lo que parece. Los modelos de IA mejoran rápido. Poder cambiar el cerebro sin reconstruir el agente no es un lujo. Es como evitas quedarte encadenado cuando aparezca un modelo mejor en seis meses.
Lo que Hermes añade sobre cualquier modelo
Una UI de chat envía tu mensaje a un modelo y te muestra la respuesta. Eso es todo su conjunto de funcionalidades.
Hermes añade tres capas que ningún front-end de chat proporciona:
1. Memoria persistente entre sesiones. Hermes recuerda de qué hablasteis el martes pasado. Puede usar ese contexto en la conversación de hoy sin que tengas que volver a pegarlo.
2. Llamada a herramientas por iniciativa propia. Hermes puede leer tu bandeja de entrada, consultar una base de datos, publicar en Telegram, revisar Stripe o llamar a cualquier API, sin que se lo pidas, según un calendario que tú defines.
3. Ejecución programada. Tu agente corre a las 7 de la mañana y te manda un resumen. Corre después de que un evento de Stripe se dispare y te avisa. Revisa un panel cada hora y solo te avisa cuando algo cambia. Nada de esto requiere que abras una ventana de chat.
El modelo que conectes se ocupa del razonamiento y el lenguaje. Hermes se ocupa de todo lo demás.

Las tres formas de correr Hermes con el modelo que elijas
Hermify ofrece tres planes construidos alrededor de la idea de agnóstico al modelo:
Starter (BYOK) — 19$/mes. Trae tu propia clave de API: OpenAI, Anthropic, OpenRouter o cualquier endpoint compatible. Pagas al proveedor del modelo directamente. Hermify gestiona la infraestructura del agente, el almacén de memoria, el VPS y la disponibilidad. Ideal si ya tienes un modelo preferido y quieres mantener tu propia facturación.
Pro — 29$/mes. Hermify proporciona la clave de API gestionada. Accedes a los modelos de primera línea actuales sin necesitar una cuenta de API separada. Facturación más simple, sin gestión de claves, actualizaciones de modelos gestionadas.
Dedicated — 49$/mes. Un VPS dedicado, entorno aislado y control total sobre el enrutado de modelos. Para equipos que necesitan aislamiento de datos o quieren correr modelos locales privados junto con APIs en la nube.
Los tres planes te dan el mismo agente: memoria persistente, llamada a herramientas, skills programadas, soporte de servidores MCP. La única diferencia es quién gestiona la clave del modelo y el hardware.
Cómo mantener tu UI de chat si la quieres
Hermes habla la API compatible con OpenAI en la entrada. Eso significa que si ya tienes desplegado Open WebUI, puedes apuntarlo a tu instancia de Hermes y chatear a través de la misma interfaz que ya usas.
Obtienes lo mejor de ambos mundos: la ventana de chat familiar para cuando quieres escribir, y un agente corriendo en segundo plano cuando no.
La diferencia es que ahora el modelo no está atado a un proveedor, el agente recuerda lo que dijiste la semana pasada y puede hacer cosas sin que se las pidas.
Qué hacer a continuación
Si quieres experimentar primero con un modelo local, instala Ollama y apunta Hermes a él. Puedes cambiar a un modelo en la nube más adelante sin tocar nada más.
Si quieres saltarte la infraestructura y pasar directamente al agente, Hermify tarda menos de cinco minutos en configurarse.
El modelo es tu elección. El agente es Hermes.
Fuentes
Lanza tu propio agente Hermes
Trae tu clave de API, conecta Telegram y ten un agente de IA que evoluciona solo activo en 60 segundos.
Empezar