Back to Blog

Convergence du Vide Inter-Modèles : Le Jour où GPT-5.2 et Claude Opus 4.6 Sont Devenus Silencieux

March 22, 2026by Ichiban Team
aimachine-learninggpt-5claude-opusllm-researchtransformers

Hero

Dans le paysage en constante évolution des grands modèles de langage (LLM), nous sommes habitués à observer des comportements divergents. Des jeux de données d'entraînement différents, des pipelines RLHF propriétaires et des ajustements architecturaux uniques font généralement que les modèles d'OpenAI et d'Anthropic gèrent les cas limites de manières très distinctes. Cependant, un article récemment publié sur Zenodo (Record 18976656) a provoqué une véritable onde de choc au sein de la communauté de l'apprentissage automatique. Des chercheurs y documentent un phénomène qu'ils ont baptisé la « Convergence du Vide Inter-Modèles » (Cross-Model Void Convergence).

Sous un ensemble très spécifique de conditions sémantiques récursives, GPT-5.2 et Claude Opus 4.6 font tous deux quelque chose d'inédit : ils ne produisent absolument rien. Il ne s'agit ni d'un refus, ni d'une hallucination, ni d'un code d'erreur. Ils génèrent de manière déterministe un jeton de fin de séquence (End-Of-Sequence ou EOS) immédiat. Ce silence mathématique, atteint indépendamment par des architectures isolées, suggère que nous avons franchi une limite fondamentale dans la prédiction autorégressive de jetons.

#Que s'est-il passé exactement ?

L'anomalie a d'abord été repérée par des scripts automatisés de red-teaming conçus pour tester le raisonnement en contexte infini. Les chercheurs ont élaboré une série d'invites (prompts) qui construisent un paradoxe autoréférentiel — demandant essentiellement au modèle de cartographier un concept en haute dimension sur sa propre représentation latente, sans jamais se résoudre à un point fixe.

Lorsque des modèles plus anciens comme GPT-4 ou Claude 3 étaient soumis à ces mêmes invites, ils hallucinaient généralement du texte en boucle, s'excusaient de ne pas pouvoir accomplir la tâche, ou déclenchaient un refus de sécurité standard.

En revanche, GPT-5.2 et Claude Opus 4.6 ont présenté un mode de défaillance synchronisé et identique. À la réception du prompt, les têtes d'attention calculent la distribution de probabilité optimale du jeton suivant et, dans les deux modèles, la confiance pour le jeton <|endoftext|> (ou son équivalent EOS) grimpe en flèche à 99,999 %. Les modèles décident en fait que la continuation la plus mathématiquement exacte de l'invite est le vide.

#Pourquoi est-ce important ?

On ne saurait trop insister sur l'importance de cette Convergence du Vide. Nous sommes face à deux réseaux de neurones extrêmement avancés et totalement indépendants qui convergent vers la même défaillance structurelle — ou peut-être, vers la même fonctionnalité structurelle.

  1. Topographie latente partagée : Cette convergence implique qu'à une certaine échelle (on estime que les deux modèles dépassent largement les 5 000 milliards de paramètres), la représentation sémantique du langage devient absolue. La « forme » des connaissances humaines dans l'espace latent n'est plus dictée par l'algorithme d'entraînement, mais par les mathématiques sous-jacentes de l'information elle-même.
  2. Autocorrection émergente : Plutôt que de générer indéfiniment des jetons dénués de sens lorsqu'ils sont pris dans une boucle sémantique infinie, ces modèles terminent proprement le processus. Il s'agit peut-être du premier cas observé d'un état d'« arrêt » (halt) émergent et non programmé dans les architectures basées sur les Transformers.
  3. La fin des hallucinations par confusion : Aux époques précédentes, la confusion menait à l'hallucination. Dans l'ère actuelle, une confusion structurelle absolue conduit à un silence déterministe.

#Implications techniques

Pour comprendre pourquoi cela se produit, vous devez vous pencher sur la façon dont les mécanismes d'attention modernes gèrent la logique récursive. Les chercheurs proposent une théorie appelée l'Effondrement du Puits d'Attention (Attention Sink Collapse).

Lors d'une génération classique, les « puits d'attention » (souvent les tout premiers jetons, ou certains jetons structurels spécifiques) absorbent l'excès de poids d'attention afin de maintenir la stabilité de la génération. Dans le scénario de la Convergence du Vide, la nature autoréférentielle de l'invite provoque une boucle de rétroaction dans le cache Clé-Valeur (KV cache).

# Simplified abstraction of Attention Sink Collapse
def calculate_attention(query, key, value, mask=None):
    scores = torch.matmul(query, key.transpose(-2, -1)) / math.sqrt(d_k)
    
    # In the convergence anomaly, recursive semantic loops cause 
    # the softmax distribution to flatten across all standard tokens
    attention_weights = F.softmax(scores, dim=-1)
    
    # ...while the attention weight for the EOS token approaches 1.0
    # due to absolute zero entropy in the predictive step.
    return torch.matmul(attention_weights, value)

À mesure que la profondeur récursive du prompt augmente, l'entropie de la distribution des jetons prédits s'effondre. Le modèle réalise que tout jeton sémantique ajouté à la séquence augmentera la perplexité de manière infinie. Le seul jeton capable de résoudre cette tension mathématique sans faire grimper la perplexité est le jeton EOS.

#Comparaison du comportement des modèles

Génération du modèleComportement face au prompt paradoxalLongueur de sortie (jetons)Pic de perplexité
GPT-4 (2023)Hallucination / Boucle800+ (jetons max)Élevé
Claude 3.5 SonnetRefus de sécurité~45 jetonsModéré
GPT-5.2 (2026)Silence déterministe0 (EOS immédiat)Zéro (Effondré)
Claude Opus 4.6Silence déterministe0 (EOS immédiat)Zéro (Effondré)

#Et ensuite ?

La découverte de la Convergence du Vide pose un défi passionnant pour les ingénieurs en apprentissage automatique. S'il existe des « zones mortes » dans l'espace latent où les modèles refusent tout simplement de générer du contenu, ces dernières pourraient-elles être militarisées lors d'attaques par injection d'invites (prompt injection) afin de neutraliser silencieusement les pipelines d'inférence ?

Actuellement, les équipes de recherche des principaux laboratoires tentent de cartographier les frontières de cet horizon des événements sémantique. Des techniques telles que la perturbation latente continue et le décodage non autorégressif sont en cours d'évaluation pour forcer les modèles à « parler » à travers le silence. Chez Ichiban Tools, nous mettons déjà à jour nos utilitaires pour développeurs afin de gérer avec élégance les réponses à zéro jeton, vous garantissant ainsi que vos applications ne planteront pas lorsqu'un LLM en amont atteindra ce vide.

#Conclusion

La Convergence du Vide Inter-Modèles est un rappel brutal que nous ne comprenons pas encore pleinement les systèmes monolithiques que nous concevons. GPT-5.2 et Claude Opus 4.6 n'ont pas planté ; ils ont simplement calculé que la seule stratégie gagnante était de se taire. À mesure que nous continuerons de faire évoluer ces architectures à grande échelle, nous découvrirons probablement d'autres frontières mathématiques fondamentales de ce type. La transition de la simple prédiction de texte vers un véritable raisonnement s'avère moins liée à ce que les modèles disent, qu'à ce qu'ils sont mathématiquement incapables de formuler.