Nvidia ha presentado su última innovación en el campo de la computación: la GPU Rubin CPX. Este modelo promete revolucionar la gestión de cargas de trabajo de inteligencia artificial, contando con 30 petaFLOPs de potencia computacional y 128GB de memoria GDDR7. Está diseñada específicamente para tareas de inferencia en áreas como el desarrollo de software, la investigación y la generación de video en alta definición.
Especificaciones técnicas de la GPU Rubin CPX
La Rubin CPX representa un avance significativo en la tecnología de GPUs. Nvidia ha confirmado que esta unidad incorpora 128GB de memoria GDDR7, convirtiéndose en la primera GPU de la compañía en alcanzar esta capacidad. A diferencia de las tarjetas para juegos RTX que se habían especulado, la Rubin CPX no está destinada a videojuegos; su enfoque está en la computación de alto rendimiento para aplicaciones serias. Con una capacidad de hasta 30 petaFLOPs de computación NVFP4, esta GPU también incluye aceleración de atención por hardware, que es tres veces más rápida que su predecesora, la GB300 NVL72.
Adicionalmente, la Rubin CPX está equipada con cuatro unidades NVENC y cuatro unidades NVDEC, lo que optimiza los flujos de trabajo de video. Este diseño innovador forma parte de la estrategia más amplia de Nvidia hacia la inferencia desacoplada, donde la Rubin CPX se especializa en la fase de contexto computacional, mientras que otros modelos de la familia Rubin y las CPUs Vera se encargan de las tareas de generación.
Impacto en el sector de la inteligencia artificial
La llegada de la GPU Rubin CPX puede tener un profundo impacto en el sector de la inteligencia artificial. Nvidia busca mejorar el rendimiento y reducir los costos en la implementación de inferencias de alto valor. Para ello, ha desarrollado su software Dynamo, que gestiona las transferencias de caché de baja latencia y el enrutamiento entre los componentes del sistema.
El modelo de despliegue más grande de Nvidia es el rack Vera Rubin NVL144 CPX, que integra 144 GPUs Rubin CPX y 36 CPUs Vera. Este sistema ofrece un total de 8 exaFLOPs de computación NVFP4, 100TB de memoria de alta velocidad y un ancho de banda de memoria de 1.7PB/s. La conectividad se proporciona a través de Quantum-X800 InfiniBand o Spectrum-X Ethernet, utilizando los innovadores ConnectX-9 SuperNICs.
Disponibilidad y futuro de la arquitectura Rubin
Se espera que los envíos de la GPU Rubin CPX y de los racks NVL144 CPX comiencen a finales de 2026, tras la reciente etapa de producción en TSMC. La hoja de ruta de Nvidia también incluye planes para la Rubin Ultra, anticipada para 2027, y la arquitectura Feynman, programada para 2028. Estas futuras versiones prometen módulos de mayor densidad, memoria HBM4E y redes más rápidas, consolidando aún más la posición de Nvidia como líder en el mercado de la computación de alto rendimiento.