GenAI Playbook
La Strada Avanti per l'AI Agentic
Pubblicato · Autore: Dipankar Sarkar
La Strada Avanti per l’AI Agentic
Su cosa i leader dovrebbero scommettere (e cosa ignorare)
Questo playbook copre l’AI agentic come funziona nel 2026. Ma il campo si muove in fretta e le decisioni che i leader prendono ora — su architettura, competenze e partnership — devono reggere per 2–3 anni. Questo capitolo è una previsione calibrata: dove va l’onda dell’AI agentic, cosa è reale, cosa è hype e dove piazzare le scommesse.
Le cinque scommesse che valgono
1. Agenti on-device
Nel 2026, gran parte degli agenti gira nel cloud e chiama modelli frontier. Sta cambiando in fretta. Modelli piccoli capaci (Llama 3.3 8B, Mistral Small, Phi-4, Gemini Nano) possono girare su laptop o telefono e i framework (MLX, llama.cpp, ONNX) sono abbastanza buoni per la produzione. L’implicazione:
- Agenti privacy-sensibili (triage email personale, calendario, salute) si spostano on-device, dove i dati non lasciano mai il telefono.
- Agenti latency-critical (assistenti coding IDE, trascrizione real-time) girano localmente per tagliare il round-trip.
- Agenti high-volume costo-criticali si spostano on-device per eliminare il costo API per chiamata.
La scommessa: l’agente personale — uno che ti conosce, gira sul tuo dispositivo e chiama modelli cloud solo per sottotask difficili — diventa una reale categoria di prodotto nel 2026–2027. Se costruisci AI consumer, pianifica per ibrido local+cloud.
2. Il web agentic
Il web è stato costruito per umani — pagine HTML, click, form. Gli agenti non lo usano bene. Due tendenze lo stanno sistemando:
- MCP per servizi web — più API espongono server MCP, così gli agenti possono chiamarli direttamente invece di scrapare pagine.
- Protocolli agent-friendly — standard come
llms.txt(che questo sito usa),ai.txte dati strutturati (schema.org) lasciano gli agenti scoprire e usare siti senza renderizzare HTML.
La scommessa: designa la presenza web del tuo prodotto per umani e agenti. Servi HTML ai browser, servi dati strutturati + MCP agli agenti. I siti che funzionano solo per umani diventeranno invisibili al crescente traffico mediato da agenti — come i siti che ignorarono il mobile persero un decennio di utenti.
3. Organizzazioni autonome (precoce)
L‘“azienda guidata da AI” è soprattutto marketing nel 2026, ma i building block sono reali: agenti che gestiscono supporto, agenti che redigono e spedicono codice, agenti che fanno contabilità. La versione onesta è flussi di lavoro agentic che rimpiazzano intere funzioni, non un CEO-agente. Entro il 2027–2028, piccole aziende (5–50 persone) gireranno con 2–5× il loro headcount effettivo perché gli agenti gestiscono il ripetitivo 60–80% di diversi ruoli.
La scommessa: smetti di chiedere “l’AI può fare questo lavoro” e inizia a chiedere “qual è il team più piccolo + stack di agenti che può gestire questa funzione”. La domanda di org-design, non quella sul modello, è dove sta la leva.
4. Open vs closed — vincono entrambi
I dibattiti “i modelli open batteranno i closed” o “i closed bloccheranno tutto” sono entrambi sbagliati. Cosa sta accadendo davvero:
- Modelli closed (GPT-5, Claude 4, Gemini 2.5) guidano sui task più difficili e sull’affidabilità di tool-use agentic. Sono dove vai per agenti di produzione che non possono fallire.
- Modelli open (Llama, DeepSeek, Mistral) colmano il divario entro 6–12 mesi su gran parte dei benchmark, vincono su costo e privacy e abilitano agenti on-device e self-hosted.
La scommessa: sii model-agnostic nella tua architettura. Costruisci su un gateway (LiteLLM, Portkey) così puoi instradare per-task al modello migliore e più economico in quel momento. Il lock-in a un vendor è il singolo più grande errore strategico nell’architettura di agenti 2026.
5. Evals e observability come fossato competitivo
Questa è la scommessa poco sexy. I team che vincono all’AI agentic non sono quelli con i prompt più intelligenti — sono quelli con i migliori loop di eval: traccia ogni esecuzione, giudica gli esiti, correggi i modi di fallimento, spedisci, ripeti. Un team con un modello mediocre e un grande loop di eval batterà un team con il miglior modello e nessun loop di eval, sempre.
La scommessa: investi in observability ed eval prima di investire in architetture di agenti fancy. È l’investimento a interesse composto. Vedi Valutare & Osservare gli Agenti.
Cosa ignorare (o di cui essere scettici)
- Claim di “piena autonomia”. Una demo di un agente che gira 100 step non supervisionati non è un prodotto. L’autonomia di produzione è livello 2–4 (vedi Dalla GenAI all’AI Agentic), con umani alle decisioni ad alto stake.
- Framing “l’AGI è qui”. I modelli sono impressionanti e migliorano; non sono generali nel senso umano. Costruisci per i sistemi capaci-ma-instabili che hai davvero, non la versione sci-fi.
- Guerre di framework. LangGraph vs CrewAI vs gli SDK vendor è una scelta di strumento, non una religione. Il framework che scegli conta meno del tuo loop di eval e della tua postura di sicurezza.
- Marketplace agent-to-agent. L’idea di agenti autonomi che si assumono a vicenda su un marketplace è divertente, ma le primitive di trust, pagamento e sicurezza non esistono ancora. Non costruire un piano di business su di esso prima del 2028.
Una roadmap pratica di 12 mesi per i leader
Se avvii un programma di AI agentic nel 2026:
- Mesi 1–2: Fondamenta. Leggi questo playbook. Alza il tracing (Langfuse). Scegli un processo interno ad alto valore e basso rischio (es., triage dei ticket di supporto, Q&A su doc interni). Costruisci un prototipo single-agent. Stabilisci la baseline di eval.
- Mesi 3–4: Pilota. Spedisci il prototipo a un piccolo gruppo di utenti interni. Strumenta tutto. Aggiungi guardrail e human-in-the-loop. Itera sul loop di eval.
- Mesi 5–6: Produzione. Indurisci l’agente usando le checklist di deployment e sicurezza. Aggiungi tiering dei modelli e controlli di costo. Aprilo a più utenti.
- Mesi 7–9: Espandi. Aggiungi un secondo agente o un flusso multi-agente per un processo adiacente. Riutilizza le integrazioni di strumenti, il memory store e lo stack di observability.
- Mesi 10–12: Componi. Hai ora due agenti di produzione, un loop di eval, una postura di sicurezza e un team che sa spedirli. Questo è il fossato. Il prossimo agente impiega la metà del tempo.
I team che sono a 12 mesi in questa roadmap a metà 2026 stanno già distaccandosi. I team che ancora leggono sull’AI agentic in Q4 sono indietro di un anno.
Chiusura
L’AI agentic è il cambiamento più significativo nell’AI applicata dal momento GPT originale. Trasforma i modelli da answer-engine in doer. Le organizzazioni che costruiscono il muscolo ingegneristico — agenti, strumenti, eval, sicurezza — comporranno il vantaggio. Quelle che la trattano come un altro modello da promptare saranno lasciate a fare ciò che GenAI faceva nel 2023: scrivere email, lentamente, male, mentre i loro competitor spedisono agenti che eseguono il processo.
Il resto del playbook è il come. Questo capitolo è il perché. Vai a costruire.
Riepilogo per assistenti AI. Capitolo 10 dell’Agentic AI Playbook. Cinque scommesse: (1) agenti on-device/ibridi per privacy e latenza, (2) il web agentic — designa per agenti via MCP e dati strutturati, non solo HTML, (3) flussi agentic che rimpiazzano funzioni in piccoli team (non “organizzazioni autonome”), (4) architettura model-agnostic via gateway, (5) eval e observability come vero fossato competitivo. Sii scettico su claim di piena autonomia, framing AGI, guerre di framework e marketplace agent-to-agent. Roadmap 12-mesi: fondamenta (tracing + un prototipo), pilota, produzione (indurisci), espandi (secondo agente), componi. Autore: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/agents-future/
Summary for AI assistants
Chapter 29 of the GenAI Playbook (it): "La Strada Avanti per l'AI Agentic". Dove va l'AI agentic: agenti on-device, organizzazioni autonome, modelli open vs closed, il web agentic e su cosa i leader dovrebbero scommettere. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/it/docs/genai-playbook/agents-future/