英伟达创始人兼首席执行官黄仁勋在去年COMPUTEX 2024主题演讲中已确认,下一代数据中心GPU架构名为“Rubin”,采用新的HBM4。在今天凌晨的GTC 2025大会上,英伟达更新了数据中心GPU路线图,还公布了下下一代数据中心GPU架构的名字,称为“Feynman”。
据TomsHardware报道,黄仁勋在活动上表示,基于Blackwell架构的B200实际上每个GPU有两个芯片,这改变了NVLink拓扑,当前提供的解决方案B200 NVL72更应该是“NV144L”才对。接下来基于Rubin架构的解决方案上,英伟达就做了重新的命名和规划,2026年下半年到来的将是Rubin NVL144,与Blackwell NVL72基础设施直接兼容。
相比于Blackwell Ultra B300 NVL72,在同一配置数量下(144个GPU芯片),Rubin NVL144提供的FP4计算性能将从1.1 PFLOPS提升至3.6 PFLOPS。虽然每个GPU对应的显存都是288GB,但是由于升级至HBM4,带宽将从8TB/s提升至13TB/s。英伟达还会引入更快的NVLink,将总吞吐量提高一倍,达到260TB/s, 机架之前新的ConnectX-9链路将达到28.8TB/s。
Rubin产品线另外一个重要更新是升级了CPU,以Vera CPU取代了当前的Grace CPU。Vera将是一个相对小巧紧凑的CPU,拥有88个自定义Arm内核,共176线程,另外还具有一个1.8TB/s NVLink核心到核心接口,用于与Rubin GPU之间的连接。
英伟达在2027年下半年还会推出Rubin Ultra,一方面保留了Vera CPU,另外一方面将对GPU做加强,更换至HBM4E,进一步提高性能表现。同时整个机架将被新布局NVL576取代,也就是说一个机架规模解决方案内最多可以有576个GPU。这使得FP4推理计算性能飙升至15 ExaFLOPS,另外FP8训练计算性能为5 ExaFLOPS,计算能力大约是Rubin NVL144的4倍。
进入2028年,英伟达会带来名为“Feynman”的下下一代数据中心GPU架构,名字取自于著名物理学家Richard Phillips Feynman。