NVIDIA ha dado un nuevo paso en la frontera de la computación acelerada con el anuncio de Rubin CPX, una arquitectura de GPU concebida desde sus cimientos para manejar el procesamiento de contextos masivos en inteligencia artificial. El lanzamiento se realizó durante el AI Infra Summit, marcando la entrada de la compañía en una categoría especializada de procesadores.
El CEO y fundador de NVIDIA, Jensen Huang, presentó el chip como una innovación fundamental. “Así como RTX revolucionó los gráficos y la IA física, Rubin CPX es la primera GPU CUDA diseñada específicamente para la IA de contexto masivo, donde los modelos razonan a través de millones de tokens de conocimiento a la vez”, declaró Huang.
El principal objetivo de Rubin CPX es superar las limitaciones actuales para tareas de inferencia de IA que requieren contextos extremadamente largos. Esto incluye la generación y búsqueda dentro de videos de larga duración —que pueden requerir hasta un millón de tokens por hora de contenido— y la transformación de asistentes de codificación en sistemas capaces de comprender y optimizar proyectos de software enteros.
Especificaciones y capacidades técnicas
La nueva GPU se basa en un diseño de dado monolítico que integra recursos de computación NVFP4, decodificadores y codificadores de video, y un motor de inferencia de contexto largo en un solo chip. Entre sus avances técnicos clave destacan:
Hasta 30 petaflops de computación con precisión NVFP4.
128 GB de memoria GDDR7 para acelerar las cargas de trabajo más demandantes.
Capacidades de atención 3 veces más rápidas en comparación con los sistemas NVIDIA GB300 NVL72, lo que permite a los modelos procesar secuencias de contexto más largas sin pérdida de velocidad.
Rubin CPX será el componente central de la nueva plataforma Vera Rubin NVL144 CPX, un sistema integrado MGX que empaqueta 8 exaflops de potencia de IA, 100 TB de memoria rápida y 1.7 petabytes por segundo de ancho de banda de memoria en un solo rack. NVIDIA proyecta que esta plataforma permitirá a las empresas monetizar a una escala sin precedentes, generando 5 mil millones de dólares en ingresos por tokens por cada 100 millones de dólares invertidos.
Adopción temprana en la industria
Varias empresas innovadoras en IA ya están explorando las capacidades de Rubin CPX para sus aplicaciones:
Cursor planea usarlo para ofrecer generación de código e ideas para desarrolladores con una velocidad revolucionaria.
Runway, compañía especializada en IA generativa para video, ve en Rubin CPX un salto mayor en rendimiento para crear herramientas creativas más inteligentes y generales.
Magic desarrolla modelos de fundación para agentes de IA autónomos y espera que la GPU acelere significativamente sus cargas de trabajo computacionales masivas.
El soporte software estará a cargo de la pila completa de IA de NVIDIA, incluida la plataforma Dynamo para escalar inferencia y la familia de modelos multimodales Nemotron.
Disponibilidad y contexto estratégico
NVIDIA ha anunciado que Rubin CPX se espera que esté disponible a fines de 2026. Este anuncio consolida el ritmo acelerado de innovación de la compañía y su transición hacia arquitecturas cada vez más especializadas, mientras sigue desarrollando y produciendo en masa sus generaciones actuales, como Blackwell, y gestionando la alta demanda de chips como el H200 para mercados específicos.