Comment configurer Hermes Agent avec OpenRouter

OpenRouter est le point de départ recommandé pour Hermes

Quand vous configurez Hermes Agent pour la première fois, vous devez le pointer vers un fournisseur de LLM. Le démarrage rapide officiel prend en charge Nous Portal, OpenRouter, OpenAI, Anthropic et tout endpoint compatible OpenAI. En pratique, OpenRouter est le meilleur choix pour la plupart des utilisateurs, surtout lors d'un premier déploiement.

La raison est simple : OpenRouter est une clé API unique qui vous donne accès à des centaines de modèles de différents fournisseurs. Au lieu de gérer des comptes séparés chez OpenAI, Anthropic et Nous Portal, vous avez une seule interface de facturation, une seule clé API, et un sélecteur de modèles qui ne nécessite pas de reconfigurer Hermes à chaque fois que vous souhaitez essayer quelque chose de différent.

Pour un agent auto-améliorant comme Hermes, conçu pour s'améliorer dans le temps, la capacité à changer de modèle sans modifications d'infrastructure est précieuse. Vous pouvez commencer avec un modèle moins coûteux pour un usage quotidien et passer à un modèle plus performant pour des tâches complexes sans toucher à votre installation Hermes.

Obtenir votre clé API OpenRouter

La configuration est rapide :

Rendez-vous sur openrouter.ai et créez un compte.
Naviguez vers Paramètres → Clés API et générez une nouvelle clé.
Copiez la clé, elle commence par sk-or-.
Ajoutez des crédits à votre compte. OpenRouter prend en charge la facturation à la consommation, vous pouvez donc commencer avec une petite somme.

La clé que vous copiez est celle que vous fournirez à Hermes (ou à Hermify si vous utilisez l'hébergement géré) en tant que OPENROUTER_API_KEY.

Configurer Hermes pour utiliser OpenRouter

Si vous faites tourner Hermes en local, la configuration se fait dans votre fichier config.yaml. La section pertinente ressemble à ceci :

provider: openrouter
model: anthropic/claude-3-5-sonnet
openrouter_api_key: sk-or-your-key-here

Vous pouvez aussi utiliser la commande de configuration interactive :

hermes setup

Elle vous guide dans le choix d'un fournisseur et d'un modèle, et écrit la configuration pour vous. Si vous souhaitez changer de modèle plus tard sans relancer la configuration complète, vous pouvez utiliser :

hermes model

Cela ouvre un sélecteur de modèles sans réinitialiser le reste de votre configuration.

Choisir le bon modèle sur OpenRouter

OpenRouter expose des centaines de modèles. Le bon choix dépend de votre cas d'usage et de votre budget. Voici les options pratiques pour Hermes :

Meilleurs modèles polyvalents sur OpenRouter :

anthropic/claude-3-5-sonnet : raisonnement solide, suit bien les instructions multi-étapes, idéal pour les workflows complexes. C'est le modèle avec lequel la plupart des utilisateurs Hermes commencent.
openai/gpt-4o : rapide, capable, performant sur le code et les tâches structurées.
meta-llama/llama-3.1-70b-instruct : poids ouverts, coût par token réduit, adapté aux workflows à volume élevé.
nousresearch/hermes-3-llama-3.1-405b : le modèle Hermes de Nous. S'adapte naturellement aux prompts système de Hermes Agent, puisque les deux viennent du même laboratoire.
google/gemini-2.0-flash : rapide et économique, adapté aux applications sensibles à la latence.

Approche budget : commencez avec llama-3.1-70b-instruct pour l'usage quotidien. Passez à Claude ou GPT-4o pour les tâches nécessitant un raisonnement plus fort ou des fenêtres de contexte plus larges.

L'approche Nous : nousresearch/hermes-3-llama-3.1-405b mérite d'être testé spécifiquement parce que le runtime de l'agent Hermes a été construit autour des modèles Nous. L'alignement entre le style de prompt de l'agent et l'entraînement du modèle tend à être plus étroit qu'avec des modèles tiers.

Conseils de configuration spécifiques à OpenRouter

Quelques points qui comptent spécifiquement pour OpenRouter avec Hermes :

Définissez une préférence de fournisseur. OpenRouter achemine les requêtes vers plusieurs fournisseurs d'infrastructure. Si vous utilisez des modèles Anthropic, vous pouvez fixer l'infrastructure propre d'Anthropic en définissant provider_order dans votre configuration. Cela réduit la variance de latence.

Configurez des modèles de secours. Hermes supporte des fournisseurs auxiliaires dans config.yaml. Cela signifie que si votre modèle principal est indisponible, Hermes peut basculer sur un modèle secondaire. Avec OpenRouter, vous pouvez spécifier plusieurs modèles comme alternatives sous auxiliary_providers.

Surveillez votre fenêtre de contexte. Hermes utilise la mémoire persistante et des fichiers de contexte, ce qui signifie que les prompts peuvent être longs. Les modèles avec des fenêtres de contexte plus petites (moins de 32 000 tokens) peuvent atteindre leurs limites plus vite que prévu. Si vous remarquez des réponses qui semblent ignorer le contexte récent, le modèle tronque peut-être votre fichier mémoire. Passez à un modèle avec une fenêtre de contexte plus large : Claude et Gemini offrent tous les deux 128 000 tokens ou plus.

Erreurs de configuration fréquentes

Utiliser la mauvaise URL de base. Hermes attend un endpoint compatible OpenAI. L'URL de base d'OpenRouter est https://openrouter.ai/api/v1. Certains utilisateurs utilisent par erreur l'URL OpenAI, ce qui provoque des erreurs d'authentification avec les clés OpenRouter.

Oublier l'en-tête HTTP-Referer. OpenRouter exige un en-tête HTTP-Referer dans les requêtes API pour identifier votre application. Hermes le gère automatiquement quand vous configurez openrouter comme fournisseur, mais si vous utilisez une configuration d'endpoint personnalisée, vous devez ajouter cet en-tête manuellement.

Épuisement du quota en milieu de session. OpenRouter bloque les requêtes quand vos crédits sont presque épuisés, ce que Hermes remonte comme une erreur dans le terminal ou l'interface de messagerie. Ajouter un seuil de rechargement automatique dans les paramètres OpenRouter évite que cela interrompe les workflows longs.

Choisir un modèle qui ne supporte pas les tool calls. Hermes s'appuie sur l'utilisation d'outils pour beaucoup de ses capacités (écritures de fichiers, requêtes web, tâches planifiées). Certains modèles moins coûteux sur OpenRouter ne supportent pas le tool calling. Vérifiez les capacités du modèle sur la page OpenRouter avant de changer.

Ce qui change si vous utilisez l'hébergement géré

Si vous déployez Hermes via Hermify, la configuration du fournisseur fonctionne de la même façon, mais vous saisissez votre clé API OpenRouter via le tableau de bord d'onboarding plutôt qu'en modifiant un fichier de configuration. Hermify la stocke chiffrée et l'injecte dans le runtime au démarrage.

Vous pouvez également mettre à jour votre clé fournisseur ou changer de modèle depuis le tableau de bord Hermify sans redémarrer le conteneur manuellement. C'est la principale différence opérationnelle : au lieu d'un accès SSH pour modifier config.yaml, vous utilisez l'interface de paramètres, déclenchez un redémarrage, et le changement prend effet en quelques secondes.

Le plan Starter est spécifiquement conçu autour du BYOK avec OpenRouter : vous apportez la clé, Hermify gère tout le reste. Si vous souhaitez vous passer d'un compte OpenRouter, les plans Pro et Dédié incluent l'accès au modèle sans avoir besoin de configurer un fournisseur tiers.

Une configuration de départ pratique

Si vous souhaitez une bonne configuration par défaut sans passer de temps à comparer les modèles, voici celle qui fonctionne bien pour la plupart des utilisateurs Hermes sur OpenRouter :

Fournisseur : OpenRouter
Modèle : anthropic/claude-3-5-sonnet en usage principal
Modèle de secours : meta-llama/llama-3.1-70b-instruct
Fenêtre de contexte : 200 000 tokens (supportés par Claude)
Crédit initial : 10-20 $ (dure généralement plusieurs semaines d'utilisation régulière)

À partir de là, vous pouvez affiner le modèle une fois que vous connaissez mieux vos patterns d'usage. Hermes est conçu pour des sessions longues, donc le modèle choisi affecte la qualité de la mémoire et la fiabilité des outils, pas seulement la vitesse de réponse.

Si vous souhaitez ignorer le travail de configuration et accéder plus vite à un déploiement Hermes fonctionnel, Hermify gère le câblage du fournisseur à votre place. Vous pouvez aussi lire notre comparaison sur la vraie différence de coût entre un déploiement Hermes auto-hébergé et géré avant de décider.