Agent IA avec n'importe quel modèle : utilisez ChatGPT, Claude ou le vôtre

Le problème d'être lié à un seul modèle

Quand la plupart des gens recherchent "alternative ChatGPT auto-hébergée", ils mélangent deux questions en une : où le modèle tourne, et ce que ce modèle peut faire pour eux.

Open WebUI, LibreChat et AnythingLLM résolvent la première partie. Ce sont des front-ends de chat placés devant un modèle qui vous donnent une interface de style ChatGPT que vous hébergez vous-même. Ils sont excellents dans ce qu'ils font.

Mais ils partagent tous la même contrainte fondamentale : ils attendent que vous tapiez.

La question que personne ne pose mais que tout le monde finit par vouloir voir répondue est : "Puis-je avoir un assistant qui utilise ChatGPT, ou Claude, ou Gemini, ou un Llama local, et qui travaille vraiment tout seul ?"

Oui. C'est exactement ce que fait Hermes Agent.

Plusieurs noeuds de modèles IA alimentant un hub d'agent vert central, se connectant vers email, Telegram, calendrier et icônes de base de données

Agnostique au modèle : le vrai avantage

Hermes Agent se fiche du modèle que vous utilisez. Son rôle est d'être un agent persistant avec mémoire, appels d'outils et exécution planifiée. Le modèle d'IA est enfichable : considérez-le comme le "cerveau" que vous choisissez, tandis que Hermes est le corps qui se souvient, agit et tourne selon un calendrier.

En pratique, vous pouvez connecter Hermes à :

ChatGPT (GPT-4o / GPT-4.1) avec votre propre clé OpenAI
Claude (Sonnet ou Opus) avec votre clé Anthropic
Gemini via l'API de Google
N'importe quel modèle local (Llama, Mistral, Qwen) via Ollama ou n'importe quel endpoint compatible OpenAI
OpenRouter pour router entre des dizaines de fournisseurs avec une seule clé

Vous pouvez même changer de modèle sans rien toucher d'autre. Si vous faites tourner GPT-4o comme cerveau par défaut aujourd'hui et voulez passer à Claude demain, vous mettez à jour un réglage. La mémoire, les connexions aux outils, les skills planifiées : tout se maintient.

C'est plus important que cela n'y paraît. Les modèles d'IA s'améliorent vite. Pouvoir changer le cerveau sans reconstruire l'agent n'est pas un luxe. C'est comment vous évitez d'être enfermé quand un meilleur modèle sortira dans six mois.

Ce que Hermes ajoute par-dessus n'importe quel modèle

Une UI de chat envoie votre message à un modèle et vous en affiche la réponse. C'est l'intégralité des fonctionnalités.

Hermes ajoute trois couches qu'aucun front-end de chat ne fournit :

1. Mémoire persistante entre les sessions. Hermes se souvient de ce dont vous avez parlé mardi dernier. Il peut utiliser ce contexte dans la conversation d'aujourd'hui sans que vous ayez à le recoller.

2. Appel d'outils de sa propre initiative. Hermes peut lire votre boite mail, interroger une base de données, poster sur Telegram, vérifier Stripe ou appeler n'importe quelle API, sans que vous le demandiez, selon un calendrier que vous définissez.

3. Exécution planifiée. Votre agent tourne à 7 heures du matin et vous envoie un résumé. Il tourne après qu'un événement Stripe se déclenche et vous prévient. Il vérifie un tableau de bord toutes les heures et vous alerte seulement quand quelque chose change. Rien de tout cela ne nécessite que vous ouvriez une fenêtre de chat.

Le modèle que vous branchez gère le raisonnement et le langage. Hermes gère tout le reste.

Panneau de paramètres avec un sélecteur de modèle à trois options et une coche verte sur le modèle sélectionné, entouré d'une interface de chat abstraite dans un studio sombre avec lumière chaude

Les trois façons de faire tourner Hermes avec le modèle de votre choix

Hermify propose trois offres construites autour de l'idée d'agnosticisme au modèle :

Starter (BYOK) — 19$/mois. Apportez votre propre clé API : OpenAI, Anthropic, OpenRouter ou n'importe quel endpoint compatible. Vous payez votre fournisseur de modèle directement. Hermify s'occupe de l'infrastructure de l'agent, du stockage mémoire, du VPS et de la disponibilité. Idéal si vous avez déjà un modèle préféré et voulez garder votre propre facturation.

Pro — 29$/mois. Hermify fournit la clé API gérée. Vous accédez aux modèles de premier rang actuels sans avoir besoin d'un compte API séparé. Facturation simplifiée, zéro gestion de clés, mises à jour de modèles gérées pour vous.

Dedicated — 49$/mois. Un VPS dédié, environnement isolé et contrôle total sur le routage des modèles. Pour les équipes qui ont besoin d'isolation des données ou veulent faire tourner des modèles locaux privés en parallèle des APIs cloud.

Les trois offres vous donnent le même agent : mémoire persistante, appels d'outils, skills planifiées, support des serveurs MCP. La seule différence est qui gère la clé du modèle et le matériel.

Comment garder votre UI de chat si vous le souhaitez

Hermes parle l'API compatible OpenAI en entrée. Cela signifie que si vous avez déjà Open WebUI déployé, vous pouvez le pointer vers votre instance Hermes et discuter à travers la même interface que vous utilisez déjà.

Vous obtenez le meilleur des deux mondes : la fenêtre de chat familière pour quand vous voulez taper, et un agent qui tourne en arrière-plan quand vous ne le voulez pas.

La différence c'est que maintenant le modèle n'est plus lié à un fournisseur, l'agent se souvient de ce que vous avez dit la semaine dernière, et il peut faire des choses sans qu'on le lui demande.

Que faire ensuite

Si vous voulez d'abord expérimenter avec un modèle local, installez Ollama et pointez Hermes dessus. Vous pourrez passer à un modèle cloud plus tard sans toucher à autre chose.

Si vous voulez sauter l'infrastructure et aller directement à l'agent, Hermify prend moins de cinq minutes à configurer.

Le modèle est votre choix. L'agent est Hermes.