Gemini 3.5: L'Era dell'Azione Agentic è Qui

Hero

Negli ultimi anni, la community del software engineering si è concentrata quasi esclusivamente sulla generazione. Abbiamo costruito pipeline sofisticate per spingere gli LLM a scrivere codice, generare testo e riassumere i log. Ma come vi dirà qualsiasi senior engineer che abbia lottato con complesse implementazioni di LangChain o con fragili cicli di esecuzione custom, generare testo non è la stessa cosa che portare a termine il lavoro.

Oggi, Google ha colmato questo divario con l'annuncio di Gemini 3.5: frontier intelligence with action. Questa release non è un semplice aumento di parametri o una piccola espansione della context window; si tratta di un vero e proprio cambio architetturale verso un comportamento agentic nativo.

Qui a Ichiban Tools passiamo le nostre giornate a creare utility che fanno risparmiare tempo agli sviluppatori. Abbiamo integrato profondamente gli LLM nei nostri workflow. Con Gemini 3.5, il paradigma cambia: si passa da noi che orchestriamo l'IA a l'IA che orchestra il workflow.

#Cosa è Successo

Google ha presentato la famiglia Gemini 3.5, ponendo l'accento sull'"intelligenza unita all'azione". Sebbene le iterazioni precedenti di Gemini (come la 1.5 Pro) abbiano introdotto context window enormi e incredibili capacità multimodali, si affidavano ancora in gran parte allo sviluppatore per gestire lo stato di esecuzione. Se il modello doveva effettuare una ricerca in un database, leggere un file e prendere una decisione, il codice della vostra applicazione doveva gestire ogni singola chiamata di funzione, effettuare il parsing del JSON e restituire iterativamente il contesto al modello.

Gemini 3.5 introduce un motore di esecuzione integrato. Il modello è ora in grado di pianificare a lungo termine e di utilizzare i tool in modo autonomo. Le caratteristiche chiave dell'annuncio includono:

Orchestrazione Nativa dei Tool Multi-Step: Il modello può chiamare un tool, valutare il risultato e decidere il passo successivo senza dover restituire il controllo all'applicazione host tra un'operazione e l'altra.
Caching del Contesto Orientato all'Azione: Lo stato viene mantenuto internamente durante un "action loop", riducendo drasticamente la latenza e l'overhead di token tipici dei complessi workflow agentic multi-turn.
Recovery Avanzato dagli Errori: Se la chiamata a un tool fallisce (ad esempio, un'API restituisce un errore 404 o un comando shell lancia un errore di sintassi), Gemini 3.5 è addestrato per leggere autonomamente l'errore, regolare i propri parametri e riprovare, proprio come farebbe un ingegnere in carne ed ossa.

#Perché è Importante

Se sviluppate dev tools o piattaforme interne, conoscete bene la frustrazione legata alla fragilità dei workflow basati sull'IA. Si fa un prompt a un modello per eseguire un task, gli si fornisce una suite di funzioni e si spera che non allucini un parametro obbligatorio o che non rimanga bloccato in un loop infinito di chiamate API fallite.

Gemini 3.5 cambia l'economia dello sviluppo di software agentic. Spingendo il loop "ReAct" (Reasoning and Acting) direttamente all'interno delle capacità native del modello, gli sviluppatori possono eliminare migliaia di righe di codice di orchestrazione.

Questo si traduce in una maggiore affidabilità, in una latenza inferiore e in meno tempo speso a fare da babysitter ai loop dell'IA. Per la prima volta, possiamo assegnare con sicurezza un obiettivo di alto livello ("Refactoring di questa directory per usare la nuova libreria di logging") e fidarci che il modello gestirà le micro-decisioni: trovare i file, fare le modifiche, lanciare il linter e correggere i successivi errori di sintassi.

#Implicazioni Tecniche

Dal punto di vista architetturale, l'adozione di Gemini 3.5 richiede di ripensare il modo in cui ci interfacciamo con l'API. Vediamo alcuni dei cambiamenti tecnici di cui dovrete tenere conto.

#1. Capacità Dichiarative di Alto Livello

Invece di definire micro-funzioni per ogni possibile azione atomica, ora potete fornire a Gemini 3.5 delle capabilities più ampie. L'API introduce il supporto nativo per determinati ambienti (come l'accesso al file system o l'esecuzione della shell) che potete isolare in modo sicuro all'interno di una sandbox.

import { GoogleGenAI } from '@google/genai';

const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

// Il nuovo paradigma agentic
const response = await ai.models.executeTask({
  model: 'gemini-3.5-pro',
  objective: 'Migrate the legacy CSS files in /styles to Tailwind classes in the React components.',
  sandbox: {
    type: 'local_container',
    permissions: ['read_write_workspace', 'run_tests']
  },
  config: {
    maxAutonomousTurns: 15,
    onRequiresApproval: (plan) => console.log("Approval needed for:", plan)
  }
});

// La risposta contiene l'intero percorso delle azioni intraprese, non solo del testo.
console.table(response.actionTrail);

#2. Riduzione Drastica dei Round-Trip dei Token

In precedenza, un'azione composta da 5 passaggi richiedeva 5 richieste HTTP distinte all'endpoint di inferenza, trasmettendo ogni volta l'enorme context window accumulata. L'esecuzione stateful di Gemini 3.5 significa che basta fare una sola richiesta. Il modello gestisce internamente i passaggi di ragionamento intermedi, restituendo solo il risultato finale (o fermandosi quando raggiunge un limite che richiede un'approvazione). Questa è un'enorme vittoria in termini di costi e latenza.

#3. Fallback Deterministici

Uno dei risultati tecnici più impressionanti descritti nella release è la capacità del modello di passare fluidamente a dei fallback deterministici. Se un obiettivo è troppo ambiguo, Gemini 3.5 genererà automaticamente una domanda di chiarimento mirata, piuttosto che tirare a indovinare e corrompere lo stato.

#Il Futuro di Ichiban Tools

Stiamo già sperimentando con gli endpoint in early access. Molto presto vedrete Gemini 3.5 profondamente integrato in tutto l'ecosistema di Ichiban Tools:

Miglioramenti alla CLI: I nostri strumenti CLI passeranno da assistenti single-turn ad agenti autonomi. Potrete chiedere alla CLI di "diagnosticare e risolvere l'errore di build di Webpack" e questa indagherà sui log, modificherà le configurazioni e verificherà la correzione in totale autonomia.
Editor più Intelligenti: I nostri workflow per PDF, Audio e Video supporteranno macro-comandi. Invece di applicare manualmente 10 filtri o modifiche diverse, potrete impartire direttive di alto livello ("Normalizza l'audio, taglia i silenzi e genera i marker dei capitoli") e guardare il sistema mentre le esegue.

#Conclusione

Il rilascio di Gemini 3.5 è il colpo di pistola che segna l'inizio dell'era agentic. Stiamo superando la fase in cui l'IA era considerata una novità conversazionale o un semplice motore di autocompletamento. L'IA è ora un partecipante attivo nel ciclo di vita dell'ingegneria del software: un sistema capace di agire, riprendersi dagli errori e portare a termine i task.

È ora di smettere di scrivere noioso codice boilerplate per orchestrare l'IA e di iniziare a costruire strumenti reali. La frontiera è aperta. Mettiamoci al lavoro.