AI agent vs chatbot: la vera differenza nel 2026

Chiedi un rimborso a un chatbot di assistenza. Ti restituisce una risposta cortese con un link alla policy e aspetta il tuo messaggio successivo. Chiedi un rimborso a un AI agent costruito come si deve. Cerca l'ordine, controlla la policy, apre un ticket, emette il credito se rientra nelle regole e ti dice in una frase cosa ha fatto. Entrambi hanno usato un modello linguistico. Solo uno ha portato a termine il lavoro.

Nel 2026 le parole "chatbot" e "AI agent" vengono usate come sinonimi nel marketing, e questo è un problema quando devi davvero scegliere un software. La differenza non è una questione di branding. È una differenza architetturale che riguarda cosa il sistema può fare tra un turno e l'altro, cosa ricorda da un turno all'altro e se può agire sul mondo esterno senza che tu lo guidi per mano. Questo articolo spiega quella differenza in parole semplici e ti aiuta a scegliere quello giusto per il problema che hai davanti.

La distinzione tra sola lettura e lettura-scrittura

Il riassunto più pulito in una riga è questo: un chatbot legge e risponde; un AI agent legge, scrive e agisce.

I chatbot sono interfacce conversazionali sopra una knowledge base o un modello linguistico. Tu invii testo, loro restituiscono testo. Sotto il cofano potrebbero consultare una FAQ, un indice vettoriale o un modello sottoposto a fine-tuning, ma il contratto è lo stesso: testo in entrata, testo in uscita, la conversazione prosegue solo quando la fai proseguire tu.

Gli AI agent sono runtime. Il modello linguistico è uno dei componenti all'interno di un loop che comprende anche strumenti, memoria e un planner. L'agent decide cosa fare dopo, chiama uno strumento, osserva il risultato e decide di nuovo. Va avanti finché l'obiettivo non è raggiunto o finché non si arrende. La conversazione è uno dei canali verso l'agent, non l'intero prodotto.

Ecco perché Gartner è stata così schietta sul mercato: la società ha riferito che tra le migliaia di vendor che chiamano il proprio prodotto un "AI agent", solo circa 130 sono verificabilmente agentici secondo un qualsiasi standard architetturale significativo. Quasi tutti gli altri sono chatbot in una nuova veste.

Due diagrammi di flusso affiancati. Quello a sinistra è un semplice flusso di testo a senso unico etichettato chatbot. Quello a destra è un loop chiuso etichettato agent con frecce tra ragiona, agisci, osserva e un piccolo riquadro etichettato memoria

Cinque dimensioni che li separano davvero

Prendi un qualsiasi confronto onesto fatto da un vendor che costruisce entrambi e tornano sempre le stesse cinque dimensioni. Sono utili perché ognuna è verificabile.

1. Ragionamento

Un chatbot mappa la tua domanda su una risposta. La mappatura può essere un albero decisionale, un recupero da documenti o una singola chiamata a un LLM, ma è un solo passaggio.

Un agent ragiona in loop. Il pattern dominante è ReAct, da un articolo del 2022 di Yao et al. di Princeton e Google: il modello pensa allo stato, sceglie un'azione, osserva il risultato, poi pensa di nuovo. È quel loop che permette a un agent di gestire "trova il volo più economico che mi lasci libero il meeting di martedì e prenotalo" invece di restituire semplicemente un elenco di voli.

2. Uso degli strumenti

I chatbot parlano. Gli agent chiamano strumenti: API, comandi shell, database, server MCP, ricerca, email, calendario, browser. Il Model Context Protocol ha trasformato l'accesso agli strumenti da lavoro di integrazione su misura a pattern plug-in, e il numero di server MCP pubblici è cresciuto da circa 500 a fine 2025 a un valore compreso tra 10.000 e 12.000 un anno dopo. Se un sistema non riesce a raggiungere nulla al di fuori della propria finestra di conversazione, è un chatbot.

3. Memoria

I chatbot di solito sono privi di stato tra una sessione e l'altra. Ricordano la conversazione in corso nella finestra di contesto e la dimenticano quando la sessione si chiude. Le funzioni di "memoria" in stile ChatGPT memorizzano un piccolo insieme di fatti riassunti: utili, ma limitati a circa 1.400 parole e opachi per l'utente.

Gli agent hanno un livello di memoria progettato apposta: archivi vettoriali, knowledge graph o semplici file markdown su disco. La memoria sopravvive ai riavvii, può essere ispezionata e modificata dall'utente e alimenta il loop di ragionamento a ogni turno. Per approfondire le architetture, vedi AI Assistant with Persistent Memory.

4. Azione e autonomia

Il raggio d'azione di un chatbot è una risposta. Il raggio d'azione di un agent è tutto ciò che i suoi strumenti permettono: un rimborso, un invito sul calendario, un deploy, una scrittura su database. È esattamente questo il punto, ed è anche esattamente il rischio. Gli agent arrivano con modelli di permessi, allowlist, modalità dry-run e gate con l'essere umano nel loop. I chatbot non ne hanno bisogno.

5. Apprendimento tra le sessioni

I chatbot migliorano quando li riaddestri. Gli agent migliorano in due modi in più. Alcuni memorizzano skill: procedure riutilizzabili scritte dall'agent stesso la prima volta che capisce qualcosa, e riproposte alla lettera nel successivo compito simile. Alcuni mantengono profili utente che crescono a ogni interazione. I pesi del modello non cambiano; cambiano gli appunti di lavoro dell'agent.

Quando un chatbot è la risposta giusta

Chiamare tutto agent è un errore di categoria. Moltissimi problemi reali sono ben serviti da un chatbot, e progettare un agent eccessivamente complesso per risolverli è denaro buttato.

Usa un chatbot quando:

Le domande si concentrano strettamente attorno a un piccolo numero di intenti (resi, orari di apertura, reset della password).
La risposta si trova nei tuoi documenti e l'utente vuole semplicemente arrivarci più in fretta.
Il costo di un'azione sbagliata è molto più alto del costo di un aiuto mancato, quindi non vuoi azioni autonome in primo luogo.
Vuoi latenza e costo per interazione prevedibili, senza chiamate a strumenti che gonfino l'uno o l'altro.

Un chatbot risponde tutto il giorno alle domande di assistenza clienti a una frazione del costo di un agent. Se il compito è "rispondi a questa domanda partendo dalla nostra knowledge base", non c'è motivo di aggiungere un planner e un loop di strumenti.

Quando hai davvero bisogno di un agent

Il segnale che ti serve un agent e non un chatbot è il lavoro multi-step con effetti collaterali. Se un'interazione di successo richiede che il sistema faccia diverse cose in un ordine preciso, legga uno stato da qualche parte, scriva uno stato da qualche altra parte e scelga tra percorsi diversi in base a ciò che ha trovato, stai descrivendo un agent.

Esempi concreti tratti da distribuzioni reali:

Un assistente Telegram che legge i messaggi in arrivo, redige risposte nel tuo stile, prenota lo slot sul calendario e invia la conferma, il tutto senza che tu cambi applicazione.
Un aiutante devops che tiene d'occhio una GitHub Action, apre una bozza di PR con una correzione se compare un pattern di errore noto e avvisa il reperibile solo se la correzione non funziona.
Un agent commerciale che fa ricerche su un potenziale cliente, redige il messaggio in uscita, programma il follow-up e aggiorna il CRM, poi ti chiede di approvare l'invio.

Queste non sono conversazioni di chat. La chat è il volante; l'auto è l'agent.

Gartner prevede che entro la fine del 2026 il 40% delle applicazioni aziendali includerà AI agent specifici per i compiti, rispetto a meno del 5% nel 2025, e che gli AI agent risolveranno autonomamente l'80% dei problemi comuni di assistenza clienti entro il 2029. Il cambiamento è reale. Ed è anche il motivo per cui l'avvertenza sull'"agent-washing" conta: la maggior parte dei prodotti commercializzati oggi come agent non sono costruiti come tali, e te ne accorgi mettendo alla prova se riescono a portare a termine un lavoro multi-step senza che tu li tenga sott'occhio.

Una fotografia scura di un piccolo banco da lavoro con un quaderno aperto su ricette di skill scritte a mano, un laptop che mostra un terminale nel mezzo di un compito e un telefono su un supporto che mostra una chat Telegram, le tre superfici dell'agent che lavorano insieme

Come distinguerli in 60 secondi

Quando un vendor ti fa una demo di "un AI agent", fai tre test rapidi.

Chiedigli di fare qualcosa con due passaggi e un effetto collaterale nel mondo reale. "Trova la mia ultima fattura Stripe e mandami il PDF via email." Un chatbot ti spiegherà come farlo. Un agent lo farà.
Chiudi la scheda e torna domani. Cita qualcosa di specifico dalla conversazione di ieri. Un chatbot non ha idea di cosa tu stia parlando. Un agent recupera la memoria e prosegue.
Chiedigli a quali strumenti ha accesso. Un chatbot elencherà capacità ("posso rispondere a domande sul tuo account"). Un agent elencherà strumenti ("Stripe, Gmail, GitHub, Postgres, il tuo calendario") e ti dirà quali sono consentiti per il tuo account.

Se un prodotto fallisce tutti e tre i test, è un chatbot. Non è un insulto, i chatbot sono utili. Ma stai scegliendo il livello di software sbagliato se ti serviva un agent.

Dove si colloca Hermes Agent

Se i tuoi criteri da "agent" qui sopra corrispondono a ciò di cui hai davvero bisogno, Hermes Agent è una delle opzioni open-source che vale la pena conoscere. Funziona come un singolo agent personale sempre attivo, anziché come framework di orchestrazione multi-agent, è dotato di memoria persistente in semplice markdown, supporta MCP e si connette a Telegram, Discord, Slack, WhatsApp ed email come superfici native. È BYOK (OpenAI, Anthropic, OpenRouter, endpoint personalizzati), con licenza MIT e self-hostable su un VPS da $5.

Hermes è una delle opzioni tra le tante: CrewAI per l'orchestrazione multi-agent, AutoGen per i workflow di ricerca, OpenAI Assistants API per l'uso ospitato e una lunga coda di framework. Per una panoramica testa a testa su dove si colloca ciascuno, vedi Hermes Agent vs CrewAI.

Se non vuoi gestire il runtime in prima persona, Hermify ospita un Hermes Agent gestito a $19-$59/mese con memoria, skill, MCP e Telegram già configurati. Inizia con Hermify e potrai avere un vero agent (non un chatbot) in funzione nel tuo Telegram in meno di cinque minuti.

In sintesi

La distinzione tra chatbot e agent non è una sensazione. È una questione di capire se il sistema sa ragionare in loop, usare strumenti, ricordare tra una sessione e l'altra e agire con autonomia limitata. Se sa fare tutte e quattro le cose, è un agent. Se non ne sa fare nessuna, è un chatbot. Se ne sa fare alcune, è un ibrido, e dovresti sapere quali, perché è questo che determina cosa il prodotto è davvero in grado di portare a termine per te.

Scegli il livello giusto per il lavoro. Usa un chatbot quando il lavoro è rispondere a domande. Usa un agent quando il lavoro è far andare avanti le cose.