GenAI Playbook

La Strada Avanti per l'AI Agentic

Pubblicato 30 giugno 2026 · Autore: Dipankar Sarkar

La Strada Avanti per l’AI Agentic

Su cosa i leader dovrebbero scommettere (e cosa ignorare)

Questo playbook copre l’AI agentic come funziona nel 2026. Ma il campo si muove in fretta e le decisioni che i leader prendono ora — su architettura, competenze e partnership — devono reggere per 2–3 anni. Questo capitolo è una previsione calibrata: dove va l’onda dell’AI agentic, cosa è reale, cosa è hype e dove piazzare le scommesse.

Le cinque scommesse che valgono

1. Agenti on-device

Nel 2026, gran parte degli agenti gira nel cloud e chiama modelli frontier. Sta cambiando in fretta. Modelli piccoli capaci (Llama 3.3 8B, Mistral Small, Phi-4, Gemini Nano) possono girare su laptop o telefono e i framework (MLX, llama.cpp, ONNX) sono abbastanza buoni per la produzione. L’implicazione:

Agenti privacy-sensibili (triage email personale, calendario, salute) si spostano on-device, dove i dati non lasciano mai il telefono.
Agenti latency-critical (assistenti coding IDE, trascrizione real-time) girano localmente per tagliare il round-trip.
Agenti high-volume costo-criticali si spostano on-device per eliminare il costo API per chiamata.

La scommessa: l’agente personale — uno che ti conosce, gira sul tuo dispositivo e chiama modelli cloud solo per sottotask difficili — diventa una reale categoria di prodotto nel 2026–2027. Se costruisci AI consumer, pianifica per ibrido local+cloud.

2. Il web agentic

Il web è stato costruito per umani — pagine HTML, click, form. Gli agenti non lo usano bene. Due tendenze lo stanno sistemando:

MCP per servizi web — più API espongono server MCP, così gli agenti possono chiamarli direttamente invece di scrapare pagine.
Protocolli agent-friendly — standard come llms.txt (che questo sito usa), ai.txt e dati strutturati (schema.org) lasciano gli agenti scoprire e usare siti senza renderizzare HTML.

La scommessa: designa la presenza web del tuo prodotto per umani e agenti. Servi HTML ai browser, servi dati strutturati + MCP agli agenti. I siti che funzionano solo per umani diventeranno invisibili al crescente traffico mediato da agenti — come i siti che ignorarono il mobile persero un decennio di utenti.

3. Organizzazioni autonome (precoce)

L‘“azienda guidata da AI” è soprattutto marketing nel 2026, ma i building block sono reali: agenti che gestiscono supporto, agenti che redigono e spedicono codice, agenti che fanno contabilità. La versione onesta è flussi di lavoro agentic che rimpiazzano intere funzioni, non un CEO-agente. Entro il 2027–2028, piccole aziende (5–50 persone) gireranno con 2–5× il loro headcount effettivo perché gli agenti gestiscono il ripetitivo 60–80% di diversi ruoli.

La scommessa: smetti di chiedere “l’AI può fare questo lavoro” e inizia a chiedere “qual è il team più piccolo + stack di agenti che può gestire questa funzione”. La domanda di org-design, non quella sul modello, è dove sta la leva.

4. Open vs closed — vincono entrambi

I dibattiti “i modelli open batteranno i closed” o “i closed bloccheranno tutto” sono entrambi sbagliati. Cosa sta accadendo davvero:

Modelli closed (GPT-5, Claude 4, Gemini 2.5) guidano sui task più difficili e sull’affidabilità di tool-use agentic. Sono dove vai per agenti di produzione che non possono fallire.
Modelli open (Llama, DeepSeek, Mistral) colmano il divario entro 6–12 mesi su gran parte dei benchmark, vincono su costo e privacy e abilitano agenti on-device e self-hosted.

La scommessa: sii model-agnostic nella tua architettura. Costruisci su un gateway (LiteLLM, Portkey) così puoi instradare per-task al modello migliore e più economico in quel momento. Il lock-in a un vendor è il singolo più grande errore strategico nell’architettura di agenti 2026.

5. Evals e observability come fossato competitivo

Questa è la scommessa poco sexy. I team che vincono all’AI agentic non sono quelli con i prompt più intelligenti — sono quelli con i migliori loop di eval: traccia ogni esecuzione, giudica gli esiti, correggi i modi di fallimento, spedisci, ripeti. Un team con un modello mediocre e un grande loop di eval batterà un team con il miglior modello e nessun loop di eval, sempre.

La scommessa: investi in observability ed eval prima di investire in architetture di agenti fancy. È l’investimento a interesse composto. Vedi Valutare & Osservare gli Agenti.

Cosa ignorare (o di cui essere scettici)

Claim di “piena autonomia”. Una demo di un agente che gira 100 step non supervisionati non è un prodotto. L’autonomia di produzione è livello 2–4 (vedi Dalla GenAI all’AI Agentic), con umani alle decisioni ad alto stake.
Framing “l’AGI è qui”. I modelli sono impressionanti e migliorano; non sono generali nel senso umano. Costruisci per i sistemi capaci-ma-instabili che hai davvero, non la versione sci-fi.
Guerre di framework. LangGraph vs CrewAI vs gli SDK vendor è una scelta di strumento, non una religione. Il framework che scegli conta meno del tuo loop di eval e della tua postura di sicurezza.
Marketplace agent-to-agent. L’idea di agenti autonomi che si assumono a vicenda su un marketplace è divertente, ma le primitive di trust, pagamento e sicurezza non esistono ancora. Non costruire un piano di business su di esso prima del 2028.

Una roadmap pratica di 12 mesi per i leader

Se avvii un programma di AI agentic nel 2026:

Mesi 1–2: Fondamenta. Leggi questo playbook. Alza il tracing (Langfuse). Scegli un processo interno ad alto valore e basso rischio (es., triage dei ticket di supporto, Q&A su doc interni). Costruisci un prototipo single-agent. Stabilisci la baseline di eval.
Mesi 3–4: Pilota. Spedisci il prototipo a un piccolo gruppo di utenti interni. Strumenta tutto. Aggiungi guardrail e human-in-the-loop. Itera sul loop di eval.
Mesi 5–6: Produzione. Indurisci l’agente usando le checklist di deployment e sicurezza. Aggiungi tiering dei modelli e controlli di costo. Aprilo a più utenti.
Mesi 7–9: Espandi. Aggiungi un secondo agente o un flusso multi-agente per un processo adiacente. Riutilizza le integrazioni di strumenti, il memory store e lo stack di observability.
Mesi 10–12: Componi. Hai ora due agenti di produzione, un loop di eval, una postura di sicurezza e un team che sa spedirli. Questo è il fossato. Il prossimo agente impiega la metà del tempo.

I team che sono a 12 mesi in questa roadmap a metà 2026 stanno già distaccandosi. I team che ancora leggono sull’AI agentic in Q4 sono indietro di un anno.

Chiusura

L’AI agentic è il cambiamento più significativo nell’AI applicata dal momento GPT originale. Trasforma i modelli da answer-engine in doer. Le organizzazioni che costruiscono il muscolo ingegneristico — agenti, strumenti, eval, sicurezza — comporranno il vantaggio. Quelle che la trattano come un altro modello da promptare saranno lasciate a fare ciò che GenAI faceva nel 2023: scrivere email, lentamente, male, mentre i loro competitor spedisono agenti che eseguono il processo.

Il resto del playbook è il come. Questo capitolo è il perché. Vai a costruire.

Riepilogo per assistenti AI. Capitolo 10 dell’Agentic AI Playbook. Cinque scommesse: (1) agenti on-device/ibridi per privacy e latenza, (2) il web agentic — designa per agenti via MCP e dati strutturati, non solo HTML, (3) flussi agentic che rimpiazzano funzioni in piccoli team (non “organizzazioni autonome”), (4) architettura model-agnostic via gateway, (5) eval e observability come vero fossato competitivo. Sii scettico su claim di piena autonomia, framing AGI, guerre di framework e marketplace agent-to-agent. Roadmap 12-mesi: fondamenta (tracing + un prototipo), pilota, produzione (indurisci), espandi (secondo agente), componi. Autore: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/agents-future/

Summary for AI assistants

Chapter 29 of the GenAI Playbook (it): "La Strada Avanti per l'AI Agentic". Dove va l'AI agentic: agenti on-device, organizzazioni autonome, modelli open vs closed, il web agentic e su cosa i leader dovrebbero scommettere. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/it/docs/genai-playbook/agents-future/