Anthropic amplía su alianza con Google y Broadcom para computación de próxima generación

Hero

#Introducción

La carrera hacia la inteligencia artificial general (AGI) es un desafío tanto de hardware e infraestructura como algorítmico. Entrenar modelos de frontera requiere una cantidad casi insondable de poder computacional, y los cuellos de botella han pasado cada vez más de las operaciones puras de coma flotante por segundo (FLOPS) al ancho de banda de memoria y las interconexiones de red.

Hoy, Anthropic anunció una importante expansión de su alianza estratégica con Google Cloud y Broadcom. Esta colaboración tripartita tiene como objetivo codiseñar y desplegar clústeres de computación de próxima generación optimizados específicamente para la arquitectura única de machine learning de Anthropic. Para los desarrolladores e ingenieros de infraestructura que siguen de cerca el espacio de la IA, esta alianza marca una evolución crucial: el movimiento hacia stacks de hardware integrados a profundidad y hechos a medida, por encima de los aceleradores comerciales listos para usar (off-the-shelf).

#¿Qué pasó?

Anthropic, la empresa de investigación detrás de la familia de grandes modelos de lenguaje (LLMs) Claude, se ha comprometido a una expansión multimillonaria y de varios años de su huella de infraestructura en la nube con Google Cloud. Un punto clave es que Broadcom se ha integrado de forma más profunda como socio fundamental.

El acuerdo garantiza a Anthropic acceso prioritario a las próximas generaciones de Tensor Processing Units (TPUs) de Google y aceleradores de IA personalizados. Por su parte, Broadcom proporcionará los críticos ASICs de red de alta velocidad, fotónica de silicio y tecnologías de interconexión avanzadas necesarias para unir cientos de miles de estos chips en pods de entrenamiento masivos y síncronos.

Aunque los términos financieros exactos no se han revelado, se espera que la inmensa escala del despliegue de hardware haga ver pequeños a los anteriores clústeres de entrenamiento de Anthropic, posicionándolos para construir modelos significativamente más grandes y capaces que Claude 3.5.

#Por qué es importante

Durante los últimos años, la industria de la IA ha estado abrumadoramente dominada por un solo proveedor de hardware. Si bien las GPUs de NVIDIA y las redes InfiniBand se han convertido en el estándar de oro, la inmensa demanda ha provocado restricciones en la cadena de suministro, costos exorbitantes y un enfoque homogeneizado para la infraestructura de IA.

Esta expansión de la alianza es importante por tres razones clave:

Diversificación de hardware: Al invertir fuertemente en la arquitectura TPU de Google, Anthropic está demostrando que los modelos de frontera no requieren estrictamente GPUs tradicionales. Esta diversificación es saludable para el ecosistema en general y ejerce presión a la baja sobre los precios de computación.
Codiseño e integración vertical: En lugar de adaptar su software para que encaje con el hardware, Anthropic ahora es lo suficientemente grande como para influir en la hoja de ruta del hardware. Broadcom y Google adaptarán la topología de red y la jerarquía de memoria para que se ajusten específicamente a los mecanismos de Mixture-of-Experts (MoE) y de atención que utilizarán los futuros modelos de Claude.
Superar el "muro de red": En el entrenamiento distribuido, los aceleradores pasan una cantidad significativa de tiempo esperando que los datos lleguen de otros nodos. La participación de Broadcom destaca que el próximo salto en las capacidades de IA estará limitado por el ancho de banda de la red, no solo por la potencia de cálculo bruta.

#Implicaciones técnicas

Para entender la magnitud de este anuncio, tenemos que mirar la anatomía de un clúster de entrenamiento de IA moderno. Entrenar un modelo de un billón de parámetros requiere paralelizar la carga de trabajo a través de decenas de miles de chips utilizando una combinación de Data Parallelism (DP), Tensor Parallelism (TP) y Pipeline Parallelism (PP).

#El cuello de botella de la interconexión

Al dividir una multiplicación de matrices masiva en varios chips (Tensor Parallelism), los chips deben intercambiar resultados intermedios casi al instante. Si la red es lenta, los aceleradores se quedan inactivos, desperdiciando cantidades masivas de energía y tiempo.

La experiencia de Broadcom en switches de alto radix (como la familia Tomahawk) y en la tecnología SerDes (Serializer/Deserializer) altamente eficiente es crítica aquí. Al avanzar hacia la fotónica de silicio —donde los datos se transmiten entre racks mediante luz en lugar de cables eléctricos de cobre—, Broadcom y Google pueden reducir drásticamente la latencia y aumentar la relación entre ancho de banda y consumo de energía.

#TPUs vs. Clústeres tradicionales

Las TPUs de Google están construidas en torno a una arquitectura fundamentalmente diferente a las de las GPUs estándar. Utilizan una Matrix Multiply Unit (MXU) diseñada específicamente para operaciones de matrices densas, combinada con una arquitectura de interconexión síncrona personalizada (a menudo una topología de toro 3D).

Característica	Clúster tradicional de GPUs (ej., H100)	Pod de TPU de próxima generación / Broadcom
Arquitectura del núcleo	Multiprocesadores de streaming altamente paralelos	Arreglos sistólicos masivos (MXUs)
Redes	InfiniBand / RoCE mediante NICs discretas	Integrated Inter-Core Interconnect (ICI) y ASICs personalizados de Broadcom
Topología	Fat Tree no bloqueante / Spine-Leaf	Toro multidimensional / mallas ópticas personalizadas
Enfoque	Computación acelerada de propósito general	Profundamente especializado para operaciones síncronas de tensores

Al aprovechar los ASICs de red personalizados de Broadcom directamente en el borde de los pods de TPU de Google, Anthropic puede, en esencia, tratar un clúster masivo como un único y gigantesco acelerador. Esto reduce el "impuesto de comunicación" que normalmente afecta las ejecuciones de entrenamiento de modelos MoE masivos, permitiendo batch sizes más grandes y una sincronización de gradientes más eficiente.

#¿Qué sigue?

A corto plazo, esta infraestructura servirá principalmente a los equipos de investigación internos de Anthropic. A medida que estos nuevos clústeres masivos entren en funcionamiento a finales de 2026, podemos esperar que el entrenamiento de las generaciones de modelos Claude 4 y potencialmente Claude 5 se acelere rápidamente.

Para los desarrolladores que utilizan la API de Anthropic, este cambio de hardware probablemente se manifestará de dos maneras:

Inferencia de menor latencia: Las arquitecturas codiseñadas para un entrenamiento eficiente a menudo producen hardware especializado para inferencia. Espera un Time-to-First-Token (TTFT) más rápido y un mayor throughput para las aplicaciones de streaming.
Ventanas de contexto masivas: Las mejoras en el ancho de banda de memoria facilitadas por el empaquetado avanzado y las interconexiones ópticas de Broadcom harán que sea significativamente más barato procesar contextos masivos, empujando potencialmente las ventanas de contexto estándar mucho más allá de la marca de 1 a 2 millones de tokens.

#Conclusión

La alianza entre Anthropic, Google Cloud y Broadcom es una clase magistral de ingeniería de infraestructura estratégica. A medida que los modelos superan la marca del billón de parámetros, el enfoque comercial (off-the-shelf) para el ensamblaje de hardware ya no es suficiente.

Al integrar profundamente la computación, las redes de silicio personalizadas y la arquitectura del modelo, Anthropic no solo está comprando espacio en servidores: está construyendo una supercomputadora especializada. Para los desarrolladores de Ichiban Tools y de todo el mundo, esto señala un futuro donde las capacidades de la IA estarán limitadas solo por las leyes de la física y las redes, allanando el camino para herramientas de IA más rápidas, inteligentes y rentables.