Agente IA con cualquier modelo: usa ChatGPT, Claude o el tuyo

El problema de estar atado a un solo modelo

Cuando la mayoría de la gente busca "alternativa a ChatGPT autoalojada", en realidad tiene dos preguntas mezcladas en una: dónde corre el modelo y qué puede hacer ese modelo por ellos.

Open WebUI, LibreChat y AnythingLLM resuelven la primera parte. Son front-ends de chat que se colocan delante de un modelo y te dan una interfaz estilo ChatGPT que alojas tú mismo. Son excelentes en lo que hacen.

Pero todos comparten la misma limitación fundamental: esperan a que escribas.

La pregunta que nadie hace pero que todo el mundo acaba queriendo responder es: "¿Puedo tener un asistente que use ChatGPT, o Claude, o Gemini, o un Llama local, y que trabaje de verdad por su cuenta?"

Sí. Eso es exactamente lo que hace Hermes Agent.

Múltiples nodos de modelos IA que fluyen hacia un hub de agente verde central, conectándose hacia correo, Telegram, calendario e iconos de base de datos

Agnóstico al modelo: la ventaja real

Hermes Agent no le importa qué modelo uses. Su trabajo es ser un agente persistente con memoria, llamada a herramientas y ejecución programada. El modelo de IA es enchufable: piénsalo como el "cerebro" que eliges, mientras Hermes es el cuerpo que recuerda, actúa y corre según un calendario.

En la práctica, puedes conectar Hermes a:

ChatGPT (GPT-4o / GPT-4.1) con tu propia clave de OpenAI
Claude (Sonnet u Opus) con tu clave de Anthropic
Gemini a través de la API de Google
Cualquier modelo local (Llama, Mistral, Qwen) vía Ollama o cualquier endpoint compatible con OpenAI
OpenRouter para enrutar entre decenas de proveedores con una sola clave

Incluso puedes cambiar de modelo sin tocar nada más. Si hoy corres GPT-4o como cerebro por defecto y mañana quieres pasarte a Claude, actualizas un ajuste. La memoria, las conexiones a herramientas, las skills programadas: todo se mantiene.

Esto importa más de lo que parece. Los modelos de IA mejoran rápido. Poder cambiar el cerebro sin reconstruir el agente no es un lujo. Es como evitas quedarte encadenado cuando aparezca un modelo mejor en seis meses.

Lo que Hermes añade sobre cualquier modelo

Una UI de chat envía tu mensaje a un modelo y te muestra la respuesta. Eso es todo su conjunto de funcionalidades.

Hermes añade tres capas que ningún front-end de chat proporciona:

1. Memoria persistente entre sesiones. Hermes recuerda de qué hablasteis el martes pasado. Puede usar ese contexto en la conversación de hoy sin que tengas que volver a pegarlo.

2. Llamada a herramientas por iniciativa propia. Hermes puede leer tu bandeja de entrada, consultar una base de datos, publicar en Telegram, revisar Stripe o llamar a cualquier API, sin que se lo pidas, según un calendario que tú defines.

3. Ejecución programada. Tu agente corre a las 7 de la mañana y te manda un resumen. Corre después de que un evento de Stripe se dispare y te avisa. Revisa un panel cada hora y solo te avisa cuando algo cambia. Nada de esto requiere que abras una ventana de chat.

El modelo que conectes se ocupa del razonamiento y el lenguaje. Hermes se ocupa de todo lo demás.

Panel de ajustes con selector de modelo con tres opciones y una marca verde en el modelo seleccionado, rodeado de una interfaz de chat abstracta en un entorno oscuro con luz cálida

Las tres formas de correr Hermes con el modelo que elijas

Hermify ofrece tres planes construidos alrededor de la idea de agnóstico al modelo:

Starter (BYOK) — 19$/mes. Trae tu propia clave de API: OpenAI, Anthropic, OpenRouter o cualquier endpoint compatible. Pagas al proveedor del modelo directamente. Hermify gestiona la infraestructura del agente, el almacén de memoria, el VPS y la disponibilidad. Ideal si ya tienes un modelo preferido y quieres mantener tu propia facturación.

Pro — 29$/mes. Hermify proporciona la clave de API gestionada. Accedes a los modelos de primera línea actuales sin necesitar una cuenta de API separada. Facturación más simple, sin gestión de claves, actualizaciones de modelos gestionadas.

Dedicated — 49$/mes. Un VPS dedicado, entorno aislado y control total sobre el enrutado de modelos. Para equipos que necesitan aislamiento de datos o quieren correr modelos locales privados junto con APIs en la nube.

Los tres planes te dan el mismo agente: memoria persistente, llamada a herramientas, skills programadas, soporte de servidores MCP. La única diferencia es quién gestiona la clave del modelo y el hardware.

Cómo mantener tu UI de chat si la quieres

Hermes habla la API compatible con OpenAI en la entrada. Eso significa que si ya tienes desplegado Open WebUI, puedes apuntarlo a tu instancia de Hermes y chatear a través de la misma interfaz que ya usas.

Obtienes lo mejor de ambos mundos: la ventana de chat familiar para cuando quieres escribir, y un agente corriendo en segundo plano cuando no.

La diferencia es que ahora el modelo no está atado a un proveedor, el agente recuerda lo que dijiste la semana pasada y puede hacer cosas sin que se las pidas.

Qué hacer a continuación

Si quieres experimentar primero con un modelo local, instala Ollama y apunta Hermes a él. Puedes cambiar a un modelo en la nube más adelante sin tocar nada más.

Si quieres saltarte la infraestructura y pasar directamente al agente, Hermify tarda menos de cinco minutos en configurarse.

El modelo es tu elección. El agente es Hermes.