Gemini 3.5 : L'ère de l'action agentique est arrivée

Ces dernières années, la communauté de l'ingénierie logicielle s'est presque exclusivement concentrée sur la génération. Nous avons bâti des pipelines complexes pour inciter les LLM à écrire du code, générer du texte ou résumer des logs. Pourtant, comme vous le dira n'importe quel développeur senior ayant lutté avec des implémentations complexes de LangChain ou des boucles d'exécution maison un peu fragiles : générer du texte, ce n'est pas la même chose qu'accomplir une tâche.
Aujourd'hui, Google a comblé ce fossé avec l'annonce de Gemini 3.5: frontier intelligence with action. Cette nouvelle version n'est pas une simple augmentation du nombre de paramètres ou un élargissement mineur de la fenêtre de contexte ; il s'agit d'un pivot architectural fondamental vers un comportement agentique natif.
Chez Ichiban Tools, nous passons nos journées à concevoir des utilitaires qui font gagner du temps aux développeurs. Nous avons profondément intégré les LLM dans nos flux de travail. Avec Gemini 3.5, le paradigme change : nous ne sommes plus ceux qui orchestrons l'IA, c'est l'IA qui orchestre le workflow.
#Les nouveautés
Google a dévoilé la famille Gemini 3.5, en mettant l'accent sur "l'intelligence en action". Si les itérations précédentes de Gemini (comme 1.5 Pro) ont introduit d'immenses fenêtres de contexte et des capacités multimodales impressionnantes, elles s'en remettaient encore largement au développeur pour gérer l'état d'exécution. Si le modèle devait interroger une base de données, lire un fichier et prendre une décision, votre code applicatif devait gérer chaque appel de fonction (function call), parser le JSON et renvoyer le contexte au modèle de manière itérative.
Gemini 3.5 introduit un moteur d'exécution embarqué. Le modèle est désormais capable de planifier sur le long terme et d'utiliser des outils en toute autonomie. Voici les principales annonces de cette mise à jour :
- Orchestration native d'outils en plusieurs étapes : Le modèle peut appeler un outil, évaluer son résultat et décider de la prochaine étape sans avoir besoin de rendre le contrôle à l'application hôte entre chaque action.
- Mise en cache du contexte orientée action : L'état est maintenu en interne durant une "boucle d'action", ce qui réduit drastiquement la latence et la consommation de tokens des workflows agentiques complexes à multiples itérations.
- Reprise sur erreur améliorée : Si l'appel d'un outil échoue (par exemple, une API renvoie une erreur 404 ou une commande shell génère une erreur de syntaxe), Gemini 3.5 est entraîné pour lire l'erreur de manière autonome, ajuster ses paramètres et réessayer — exactement comme le ferait un ingénieur humain.
#En quoi cela change la donne
Si vous concevez des outils pour les développeurs ou des plateformes internes, vous connaissez la frustration des workflows IA fragiles. Vous donnez un prompt à un modèle pour exécuter une tâche, vous lui fournissez une série de fonctions, et vous croisez les doigts pour qu'il n'hallucine pas un paramètre requis ou ne reste pas bloqué dans une boucle infinie d'appels API en échec.
Gemini 3.5 transforme l'économie de la conception de logiciels agentiques. En intégrant directement la boucle "ReAct" (Reasoning and Acting) au cœur des capacités natives du modèle, les développeurs peuvent s'affranchir de milliers de lignes de code d'orchestration.
Cela se traduit par une meilleure fiabilité, une latence réduite et beaucoup moins de temps de développement passé à jouer les baby-sitters avec les boucles d'IA. Pour la première fois, nous pouvons sereinement confier un objectif de haut niveau ("Refactore ce répertoire pour utiliser la nouvelle bibliothèque de logging") et faire confiance au modèle pour gérer les micro-décisions : trouver les fichiers, effectuer les modifications, lancer le linter et corriger les erreurs de syntaxe qui en découlent.
#Implications techniques
D'un point de vue architectural, l'adoption de Gemini 3.5 nous oblige à repenser notre façon de nous interfacer avec l'API. Examinons quelques-uns des changements techniques qu'il vous faudra prendre en compte.
#1. Capacités déclaratives de haut niveau
Au lieu de définir des micro-fonctions pour chaque action atomique imaginable, vous pouvez désormais doter Gemini 3.5 de capacités bien plus vastes. L'API introduit des environnements pris en charge nativement (comme l'accès au système de fichiers ou l'exécution shell) que vous pouvez isoler dans une sandbox en toute sécurité.
import { GoogleGenAI } from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
// The new agentic paradigm
const response = await ai.models.executeTask({
model: 'gemini-3.5-pro',
objective: 'Migrate the legacy CSS files in /styles to Tailwind classes in the React components.',
sandbox: {
type: 'local_container',
permissions: ['read_write_workspace', 'run_tests']
},
config: {
maxAutonomousTurns: 15,
onRequiresApproval: (plan) => console.log("Approval needed for:", plan)
}
});
// The response contains the full trail of actions taken, not just text.
console.table(response.actionTrail);
#2. Réduction drastique des allers-retours de tokens
Auparavant, une action en 5 étapes exigeait 5 requêtes HTTP distinctes vers le endpoint d'inférence, en transmettant à chaque fois l'énorme fenêtre de contexte accumulée. L'exécution avec maintien d'état (stateful) de Gemini 3.5 signifie que vous ne faites plus qu'une seule requête. Le modèle gère les étapes de raisonnement intermédiaires en interne et ne renvoie que le résultat final (ou se met en pause s'il atteint une frontière nécessitant une approbation). C'est un gain colossal en termes de coûts et de latence.
#3. Solutions de repli déterministes
L'une des prouesses techniques les plus impressionnantes détaillées dans l'annonce est la capacité du modèle à basculer de manière transparente sur des solutions de repli déterministes (fallbacks). Si un objectif est trop ambigu, Gemini 3.5 générera automatiquement une question de clarification ciblée au lieu de deviner à l'aveugle et de corrompre l'état du système.
#La suite pour Ichiban Tools
Nous expérimentons déjà les endpoints en accès anticipé. Vous pouvez vous attendre à voir Gemini 3.5 profondément intégré dans tout l'écosystème Ichiban Tools très prochainement :
- Améliorations de la CLI : Nos outils en ligne de commande vont passer du statut d'assistants à interaction unique à celui d'agents autonomes. Vous pourrez demander à la CLI de "diagnostiquer et corriger l'échec de build Webpack", et elle enquêtera dans les logs, ajustera les configurations et vérifiera le correctif de manière totalement autonome.
- Des éditeurs plus intelligents : Nos workflows PDF, audio et vidéo prendront en charge des macro-commandes. Au lieu d'appliquer manuellement 10 filtres ou modifications différents, vous pourrez donner des directives de haut niveau ("Normalise l'audio, coupe les silences et génère des marqueurs de chapitre") et laisser l'outil exécuter la tâche.
#Conclusion
La sortie de Gemini 3.5 marque le coup d'envoi de l'ère agentique. Nous dépassons la phase où l'IA n'était qu'une curiosité conversationnelle ou un simple moteur d'autocomplétion. L'IA est désormais un participant actif dans le cycle de vie de l'ingénierie : un système capable d'agir, de se remettre d'un échec et de mener des tâches à bien de A à Z.
Il est grand temps d'arrêter d'écrire du code boilerplate pour orchestrer l'IA et de commencer à construire de véritables outils. Une nouvelle frontière s'ouvre à nous. Au travail.