Hermes Agent vs AutoGen : un agent ou plusieurs ?

Deux frameworks, deux problèmes différents

Si vous avez cherché "hermes agent vs autogen", la première chose à dire est que ce n'est pas la confrontation directe que le titre laisse imaginer. AutoGen est un framework de Microsoft Research pour construire des équipes d'agents qui conversent entre eux pour résoudre une tâche. Hermes Agent est un agent unique persistant de Nous Research qui vit sur votre portable ou un petit VPS, se souvient de vous d'une session à l'autre, et décide tout seul comment traiter chaque demande.

Les deux portent l'étiquette "framework d'agent IA", mais leur forme architecturale est suffisamment différente pour que choisir le mauvais vous coûte des semaines. Cet article explique pour quoi chaque projet est réellement optimisé, où se trouve la vraie frontière de décision, et à quoi ressemble un choix raisonnable en 2026.

Ce que fait AutoGen en réalité

AutoGen est une bibliothèque open source, à l'origine de Microsoft Research, pour orchestrer plusieurs agents propulsés par LLM dans une même conversation. La réécriture v0.4, livrée début 2026, a réorganisé le projet autour d'un noyau asynchrone et événementiel avec une API en couches : un runtime bas niveau, une couche AgentChat orientée tâche avec des primitives comme RoundRobinGroupChat et SelectorGroupChat, et AutoGen Studio pour le prototypage visuel.

Le modèle mental, c'est une réunion. Vous déclarez un ensemble d'agents, chacun avec un rôle et un system prompt : un planificateur, un développeur, un critique, un exécuteur. Un sélecteur décide qui parle ensuite. Ils prennent la parole à tour de rôle, voient les messages des autres, et convergent vers une réponse. La force, c'est que les tâches complexes se décomposent naturellement : un agent écrit du code, un autre le relit, un troisième l'exécute, un quatrième critique le résultat.

C'est pour cela qu'AutoGen est conçu. Pipelines de génération de code qui itèrent jusqu'à ce que les tests passent. Workflows de recherche où un "chercheur" et un "rédacteur" débattent d'un brouillon. Analyse de données où un agent planificateur choisit quel sous-agent invoquer. Le framework évolue vite : Microsoft consolide AutoGen et Semantic Kernel dans un Microsoft Agent Framework unifié, et le dépôt microsoft/autogen upstream continue d'avancer aux côtés du fork communautaire AG2.

La forme du coût est honnête sur le compromis. Chaque tour dans un GroupChat est un appel LLM complet avec tout l'historique cumulé. Un débat à quatre agents sur cinq tours, c'est vingt appels minimum, plus les appels d'outils. Pour des cas à fort volume et faible latence (un agent personnel qui doit répondre sur Telegram en deux secondes), ça devient cher rapidement. AutoGen est aussi une bibliothèque : vous l'importez en Python et l'exécutez à l'intérieur de votre propre service. Pas de bot Telegram, pas de mémoire persistante d'une exécution à l'autre, pas d'interface pour les utilisateurs finaux. Ça, c'est à vous de le construire.

Ce que fait Hermes Agent en réalité

Hermes Agent est un agent IA open source de Nous Research, sorti pour la première fois le 25 février 2026 et désormais en version v0.10.0. Contrairement à AutoGen, ce n'est pas une bibliothèque que vous importez : c'est un runtime que vous démarrez. Vous l'installez une fois, vous le pointez vers un fournisseur de modèles avec votre propre clé, et il tourne en processus de longue durée à qui vous parlez via Telegram, WhatsApp, Discord, Slack, Signal, ou directement en CLI.

Il y a un seul agent. Pas une équipe de personnages avec des rôles. Cet agent unique tire parti de trois couches d'état :

Mémoire centrale, stockée dans ~/.hermes/memories/ et injectée dans le system prompt au début de chaque session : ce que l'agent doit toujours savoir de vous.
Recherche de session, chaque session CLI et messagerie indexée dans SQLite avec recherche plein texte FTS5, pour que l'agent puisse retrouver ce dont vous avez parlé la semaine dernière.
Skills, fichiers markdown que l'agent charge à la demande et, surtout, crée et corrige tout seul à partir des tâches passées.

Graphe de nœuds verts lumineux sur fond sombre représentant la mémoire persistante de l'agent entre sessions

Nous avons détaillé l'architecture mémoire dans l'article sur la mémoire et les skills d'Hermes Agent. En résumé : un agent unique avec état persistant et skills auto-générées tend à battre un débat multi-agents sur du travail personnel de longue durée, parce que le contexte dont a besoin la prochaine décision est déjà disponible.

Hermes embarque six backends de terminal (local, Docker, SSH, Daytona, Singularity, Modal) et est sous licence MIT. L'auto-hébergement sur un petit VPS européen tourne autour de cinq euros par mois. Le coût marginal est dominé par votre fournisseur de modèle, pas par le runtime.

La frontière de décision

Un cadrage utile : AutoGen, c'est pour une chorégraphie multi-agents sans état que vous concevez, et Hermes, c'est pour un agent unique avec état qui grandit avec vous.

| Question | AutoGen | Hermes Agent | |---|---|---| | Abstraction centrale | Équipe d'agents qui conversent | Un agent unique persistant | | Où il vit | Dans un service Python que vous construisez | Un démon sur Telegram / WhatsApp / Discord / CLI | | Logique d'orchestration | Vous la concevez (sélecteur, group chat) | Décidée par l'agent unique à l'exécution | | État entre exécutions | Buffer de conversation par tâche | Mémoire centrale + recherche de session + skills, persistant | | Multi-agents ? | Oui, par conception | Non, agent unique délibérément | | Bon à quoi | Pipelines de code, débat, boucles plan-act-critic | Assistance personnelle, rappel, brouillons, jugement | | Forme du coût | N agents x M tours x contexte complet par appel | Un appel LLM par tour utilisateur + appels d'outils | | Interface utilisateur final | Vous la construisez | Intégrations de messagerie incluses | | Licence | MIT | MIT | | Auto-hébergeable | Oui (vous hébergez le service hôte) | Oui (Docker, SSH, Daytona, Modal et plus) |

Si vous vous retrouvez à ajouter un "agent mémoire" et un "agent profil utilisateur" à votre montage AutoGen pour que l'équipe se souvienne des choses entre réunions, c'est le signal : vous reconstruisez ce que Hermes fournit nativement. Si vous vous retrouvez à diviser des skills Hermes en "skill planificateur" et "skill critique" qui s'appellent dans un ordre fixe, c'est l'autre signal : vous reconstruisez AutoGen à l'intérieur d'un agent.

Quand AutoGen gagne

AutoGen est la bonne réponse quand :

Le travail a une forme de tâche, pas de relation. Une mission discrète arrive, les agents collaborent, une réponse sort, la conversation se termine.
Vous voulez une décomposition explicite par rôle. Un agent "chercheur" et un agent "rédacteur" produisent vraiment de meilleurs brouillons qu'un seul faisant les deux, surtout avec des boucles de critique.
Vous avez la capacité d'ingénierie pour héberger un service Python, construire l'interface dont vos utilisateurs ont besoin et payer la facture LLM multi-tours.
Vous vous intégrez dans la pile d'agents Microsoft, où les patrons d'AutoGen se rejoignent dans le Microsoft Agent Framework.
Vous tenez à l'observabilité programmatique de qui a dit quoi, dans quel ordre, avec quel résultat d'outil.

C'est la catégorie multi-agents de production. Services de génération de code, résumeurs de recherche, pipelines de relecture de documents, workflows analytiques structurés. AutoGen et ses pairs (LangGraph, CrewAI) dominent cet espace.

Quand Hermes gagne

Hermes est la bonne réponse quand :

Le travail est le vôtre, pas celui de votre équipe. Un agent personnel qui apprend votre style, vos projets, vos contacts.
Vous voulez de la mémoire longue durée à travers de nombreuses sessions, pas un buffer de conversation neuf par tâche.
L'interface doit être une surface de chat que vous utilisez déjà (Telegram, WhatsApp, Discord, Signal), pas un dashboard web à livrer.
Vous voulez ajouter des capacités en écrivant un fichier markdown de skill (ou en laissant l'agent l'écrire pour vous) plutôt qu'en déclarant une nouvelle classe d'agent avec son system prompt.
Vous tenez à la latence par tour. Un appel LLM avec contexte persistant bat cinq tours d'agents qui se parlent.

C'est la catégorie de l'agent personnel. Résumés quotidiens écrits dans votre ton. Questions rapides de rappel répondues avec le contexte de votre projet. Journal récurrent, curation de lecture, assistants de travail concentré. Nous avons comparé Hermes aux principaux outils de chat IA dans Hermes Agent vs ChatGPT, Claude et Gemini, et aux outils de workflow dans Hermes Agent vs n8n.

Démarrer avec Hermify si vous voulez un Hermes Agent géré qui tourne sur Telegram en moins d'une minute.

L'hybride honnête

Les deux ne sont pas mutuellement exclusifs. Un montage avancé raisonnable ressemble à ceci :

AutoGen gère la tâche multi-agents ponctuelle. Quand vous déclenchez une génération de code ou une recherche, un pipeline AutoGen monte la bonne équipe d'agents pour ce travail, l'exécute jusqu'au bout et renvoie un résultat structuré.
Hermes porte la relation. Votre Hermes Agent personnel est la surface avec laquelle vous parlez. Il vous connaît, se rappelle ce que vous avez demandé hier, et décide quand déléguer. Pour un travail de code, il appelle le service AutoGen en HTTP, reçoit le résultat et vous le rapporte dans l'app de messagerie de votre choix.

En pratique, cela veut dire que Hermes est l'endroit où vit l'état et AutoGen l'endroit où vit le raisonnement multi-agents lourd. Un fichier de skill dans Hermes suffit à exposer AutoGen comme un outil de plus. La direction inverse est plus dure : AutoGen n'a pas de notion native de "l'utilisateur à travers les sessions", donc construire une persistance à la Hermes dans AutoGen revient à écrire une couche mémoire que vos agents partagent.

Agent IA unique lumineux à droite échangeant des données structurées avec un petit groupe d'agents étiquetés par rôle à gauche

Coût, hébergement et dépendance

Les deux projets sont MIT et auto-hébergeables. La dépendance n'est pas le critère qui les sépare.

La forme du coût, si. Les workflows AutoGen sont dominés par la facture de tokens multi-agents : chaque agent du débat paie le coût de voir toute la conversation, à chaque tour. Une seule exécution AutoGen produisant une réponse réfléchie à une seule requête peut coûter dix à vingt fois plus que la même réponse d'un agent unique. C'est une vertu, pas un défaut, quand vous avez vraiment besoin du débat. C'est une taxe quand non.

Le coût marginal de Hermes, c'est celui du fournisseur LLM vers lequel vous le pointez (votre facture OpenAI, Anthropic ou OpenRouter), le runtime ajoutant un surcoût négligeable. Nous avons couvert les compromis entre auto-hébergement et montage géré dans Hermes Agent : hébergement vs auto-hébergement. L'usage individuel typique se situe entre cinq et trente dollars par mois côté modèle.

Comment choisir

Récap court de décision :

Si votre problème est "j'ai besoin d'une équipe d'agents spécialisés qui collaborent sur une tâche", choisissez AutoGen.
Si votre problème est "je veux une IA qui me connaît et agit en mon nom dans les apps de messagerie", choisissez Hermes.
Si votre problème est "je veux un agent personnel qui peut aussi déclencher des tâches multi-agents lourdes au besoin", mettez Hermes en façade et appelez AutoGen pour ces tâches.

Forcer l'un des deux projets à jouer le rôle de l'autre est le mode de défaillance. AutoGen n'est pas un runtime d'agent personnel et Hermes n'est pas un framework de débat multi-agents. Une fois qu'on accepte que les deux résolvent des problèmes différents, le choix devient simple et le patron hybride devient évident.