Hermes Agent vs AutoGen: agente singolo o multi-agente?

Due framework, due problemi diversi

Se hai cercato "hermes agent vs autogen", la prima cosa da chiarire è che questo non è il confronto diretto che il titolo lascia intendere. AutoGen è un framework di Microsoft Research per costruire team di agenti che conversano tra loro per risolvere un compito. Hermes Agent è un singolo agente a esecuzione prolungata di Nous Research che vive sul tuo laptop o su un piccolo VPS, ti ricorda tra una sessione e l'altra e decide autonomamente come gestire ogni richiesta.

Entrambi portano l'etichetta "framework per agenti AI", ma la forma architetturale è abbastanza diversa da costarti settimane se scegli quello sbagliato. Questo articolo analizza per cosa è ottimizzato ciascun progetto, dove si trova il vero confine decisionale e quale scelta ha senso nel 2026.

Cosa fa davvero AutoGen

AutoGen è una libreria open-source, nata originariamente da Microsoft Research, per orchestrare più agenti basati su LLM in una conversazione. La riscrittura v0.4, rilasciata all'inizio del 2026, ha riorganizzato il progetto attorno a un nucleo asincrono ed event-driven con un'API a livelli: un runtime di basso livello, un layer AgentChat orientato ai task con primitive come RoundRobinGroupChat e SelectorGroupChat, e AutoGen Studio per il prototipaggio visivo.

Il modello mentale è quello di una riunione. Dichiari un insieme di agenti, ciascuno con un ruolo e un system prompt - un pianificatore, un programmatore, un critico, un esecutore. Un selettore decide chi parla dopo. Si alternano, vedono i messaggi degli altri e convergono su una risposta. Il punto di forza è che i compiti complessi si decompongono in modo naturale: un agente scrive il codice, un altro lo rivede, un terzo lo esegue, un quarto critica l'output.

È esattamente per questo che AutoGen è stato progettato. Pipeline di generazione di codice che iterano finché i test passano. Workflow di ricerca in cui un "ricercatore" e uno "scrittore" dibattono una bozza. Analisi dati in cui un agente pianificatore sceglie quale sotto-agente invocare. Il framework si sta evolvendo rapidamente: Microsoft sta consolidando AutoGen e Semantic Kernel in un unico Microsoft Agent Framework, e il repository upstream microsoft/autogen continua in parallelo al fork community AG2.

La struttura dei costi è onesta riguardo al compromesso. Ogni turno in una GroupChat è una chiamata LLM completa con l'intera cronologia della conversazione accumulata. Un dibattito tra quattro agenti su cinque round fa un minimo di venti chiamate, più le chiamate agli strumenti. Per casi d'uso ad alto volume e bassa latenza - un agente personale che deve rispondere su Telegram in due secondi - i costi crescono in fretta. AutoGen è anche una libreria: la importi in Python e la esegui all'interno del tuo servizio. Non include un bot Telegram, memoria persistente tra le esecuzioni né un'interfaccia per gli utenti finali. Tutto questo lo costruisci tu.

Cosa fa davvero Hermes Agent

Hermes Agent è un agente AI open-source di Nous Research, rilasciato per la prima volta il 25 febbraio 2026 e ora alla versione v0.10.0. A differenza di AutoGen, non è una libreria da importare: è un runtime da avviare. Lo installi una volta, lo punti a un provider di modelli con la tua chiave, e gira come processo a lunga durata con cui parli su Telegram, WhatsApp, Discord, Slack, Signal o direttamente da CLI.

C'è un solo agente. Non un team di persone che recitano ruoli. Il singolo agente trae tutto il suo valore da tre livelli di stato:

Memoria core, salvata in ~/.hermes/memories/ e iniettata nel system prompt all'avvio della sessione - le cose che l'agente deve sempre sapere di te.
Ricerca nelle sessioni, ogni sessione CLI e di messaggistica indicizzata in SQLite con ricerca full-text FTS5, così l'agente può ritrovare ciò di cui avete parlato la settimana scorsa.
Skill, file markdown che l'agente carica su richiesta e, fatto importante, crea e aggiorna da solo partendo dai task precedenti.

Grafo di nodi luminosi verdi su sfondo scuro che visualizza la memoria persistente dell'agente tra le sessioni

Abbiamo analizzato in dettaglio l'architettura della memoria nel post su memoria e skill di Hermes Agent. La sintesi: un singolo agente con stato persistente e skill auto-generate tende a battere un dibattito multi-agente nel lavoro personale prolungato, perché il contesto necessario alla decisione successiva è già disponibile.

Hermes include sei backend terminale - local, Docker, SSH, Daytona, Singularity, Modal - ed è rilasciato con licenza MIT. Il self-hosting su un piccolo VPS europeo costa circa cinque euro al mese. Il costo marginale è dominato dal tuo provider di modelli, non dal runtime.

Il confine decisionale

Un modo utile di inquadrare la scelta: AutoGen è per la coreografia multi-agente senza stato che progetti tu, Hermes è per un singolo agente con stato che cresce con te.

Domanda	AutoGen	Hermes Agent
Astrazione principale	Team di agenti che conversano	Un singolo agente con stato a lunga durata
Dove vive	All'interno di un servizio Python che costruisci tu	Un daemon su Telegram / WhatsApp / Discord / CLI
Logica di orchestrazione	Progettata da te (selettore, group chat)	Decisa dal singolo agente a runtime
Stato tra le esecuzioni	Buffer di conversazione per task	Memoria core + ricerca sessioni + skill, persistenti
Multi-agente?	Sì, per design	No, volutamente singolo agente
Ottimale per	Pipeline di code-gen, dibattito, loop plan-act-critic	Assistenza personale, richiamo, bozze, giudizio
Struttura dei costi	N agenti x M round x contesto completo per chiamata	Una chiamata LLM per turno utente + chiamate agli strumenti
Interfaccia per utenti finali	La costruisci tu	Integrazioni di messaggistica integrate
Licenza	MIT	MIT
Self-hosted	Sì (gestisci tu il servizio host)	Sì (Docker, SSH, Daytona, Modal e altro)

Se ti ritrovi ad aggiungere un "agente memoria" e un "agente profilo utente" al tuo setup AutoGen perché il team possa ricordare le cose tra una riunione e l'altra, questo è il segnale: stai ricostruendo ciò che Hermes include già di serie. Se ti ritrovi a suddividere le skill di Hermes in una "skill pianificatore" e una "skill critico" che si richiamano in sequenza fissa, questo è l'altro segnale: stai ricostruendo AutoGen all'interno di un agente.

Quando vince AutoGen

AutoGen è la risposta giusta quando:

Il lavoro ha la forma di un task, non di una relazione. Arriva un compito discreto, gli agenti collaborano, esce una risposta, la conversazione termina.
Vuoi una decomposizione esplicita dei ruoli. Un agente "ricercatore" e un agente "scrittore" producono davvero bozze migliori rispetto a un solo agente che fa entrambe le cose, specialmente con loop di critica.
Hai la capacità tecnica di ospitare un servizio Python, costruire l'interfaccia di cui hanno bisogno i tuoi utenti e sostenere il costo LLM multi-turno.
Stai integrando nello stack di agenti Microsoft più ampio, dove i pattern AutoGen confluiscono nel Microsoft Agent Framework.
Ti interessa l'osservabilità programmatica di chi ha detto cosa, in quale ordine e con quale risultato degli strumenti.

Questa è la categoria multi-agente in produzione. Servizi di generazione di codice, sommari di ricerca, pipeline di revisione documenti, workflow analitici strutturati. AutoGen e i suoi pari (LangGraph, CrewAI) dominano questo spazio.

Quando vince Hermes

Hermes è la risposta giusta quando:

Il lavoro è tuo, non del tuo team. Un agente personale che impara il tuo stile, i tuoi progetti, i tuoi contatti.
Vuoi memoria a lungo termine su molte sessioni, non un buffer di conversazione fresco per ogni task.
L'interfaccia deve essere una superficie di chat che usi già - Telegram, WhatsApp, Discord, Signal - non una dashboard web da distribuire.
Vuoi aggiungere funzionalità scrivendo un file markdown di skill (o lasciando che sia l'agente a scriverlo per te) invece di dichiarare una nuova classe agente con un system prompt.
Ti interessa la latenza per turno. Una singola chiamata LLM con contesto persistente batte cinque turni di agenti che parlano tra loro.

Questa è la categoria degli agenti personali. Riassunti quotidiani scritti nel tuo tono. Domande di richiamo rapido risposte con il contesto dei tuoi progetti. Journaling ricorrente, curation delle liste di lettura, assistenti per il lavoro focalizzato. Abbiamo confrontato Hermes con i principali strumenti AI solo chat in Hermes Agent vs ChatGPT, Claude e Gemini, e con gli strumenti di workflow in Hermes Agent vs n8n.

Inizia con Hermify se vuoi un Hermes Agent gestito in esecuzione su Telegram in meno di un minuto.

L'ibrido onesto

I due non si escludono a vicenda. Un setup avanzato ragionevole è il seguente:

AutoGen gestisce il task multi-agente a picchi. Quando lanci un job di generazione di codice o una sessione di ricerca, una pipeline AutoGen fa partire il team di agenti giusto per quel lavoro, lo porta a termine e restituisce un risultato strutturato.
Hermes porta avanti la relazione. Il tuo Hermes Agent personale è la superficie con cui parli. Ti conosce, ricorda cosa hai chiesto ieri e decide quando delegare. Per un job di codice, chiama il servizio AutoGen via HTTP, riceve il risultato e te lo riporta nell'app di messaggistica che preferisci.

In pratica questo significa che Hermes è dove vive lo stato e AutoGen è dove risiede il ragionamento multi-agente pesante. Un file di skill in Hermes è sufficiente per esporre AutoGen come uno strumento in più. La direzione inversa è più difficile: AutoGen non ha un concetto nativo di "l'utente tra le sessioni", quindi costruire una persistenza in stile Hermes dentro AutoGen significa scrivere un layer di memoria condiviso tra gli agenti.

Singolo agente AI luminoso sulla destra che scambia dati strutturati con un piccolo cluster di agenti etichettati per ruolo sulla sinistra

Costi, hosting e lock-in

Entrambi i progetti sono rilasciati con licenza MIT e self-hostabili. Il lock-in non è il fattore differenziante.

La struttura dei costi lo è. I workflow AutoGen sono dominati dal costo dei token multi-agente: ogni agente in un dibattito paga il costo di vedere l'intera conversazione, ad ogni round. Una singola esecuzione AutoGen che produce una risposta ponderata a una sola richiesta può essere da dieci a venti volte più costosa della stessa risposta da un singolo agente. Questo è un vantaggio, non un difetto, quando hai davvero bisogno del dibattito. È un costo aggiuntivo quando non ne hai bisogno.

Il costo marginale di Hermes è il provider LLM a cui lo punti - il tuo conto OpenAI, Anthropic o OpenRouter - con il runtime che aggiunge un overhead trascurabile. Abbiamo analizzato i compromessi tra self-hosting e un setup gestito in Hermes Agent hosting vs self-hosting. L'utilizzo individuale tipico si colloca tra i cinque e i trenta dollari al mese lato modello.

Come scegliere

Una sintesi decisionale rapida:

Se il tuo problema è "ho bisogno di un team di agenti specializzati che collaborino su un task" - scegli AutoGen.
Se il tuo problema è "voglio un'AI che mi conosca e agisca per mio conto su app di messaggistica" - scegli Hermes.
Se il tuo problema è "voglio un agente personale che possa anche dispatchare job multi-agente pesanti quando necessario" - usa Hermes come porta d'ingresso e chiama AutoGen per quei job.

Forzare uno dei due progetti a fare il lavoro dell'altro è la modalità di fallimento. AutoGen non è un runtime per agenti personali e Hermes non è un framework per dibattiti multi-agente. Una volta accettato che i due risolvono problemi diversi, la scelta diventa semplice e il pattern ibrido inizia ad apparire ovvio.