英伟达(NVIDIA)首席执行官黄仁勋18日在GTC大会上宣布了AI芯片的最新进展,也谈到英伟达在推理模型、代理型AI、光通讯和机器人技术方面的工作。
以下是黄仁勋主题演讲的一些重点:
1. Blackwell芯片全面投产,发表新款后继产品Nvidia Blackwell Ultra
黄仁勋表示,英伟达的Blackwell现在已全面投入生产。下一代的Blackwell Ultra系列将在2025年下半年推出。
Blackwell Ultra NVL72平台具有两倍的带宽和1.5倍更快的内存,将用于加速建立代理型AI、实体型AI和推论模型。
届时,将问世的GB300 NVL72服务器,会连接72颗Blackwell Ultra GPU与36颗安谋Neoverse架构Grace CPU,其AI效能比GB200 NVL72提升1.5倍。
英伟达表示,预期今年下半年起,合作伙伴包括Aivres、华擎、华硕、鸿海集团、技嘉、英业达、和硕、云达科技、纬创与纬颖、思科、戴尔、慧与科技、联想与AMD等公司,都将推出各种搭载Blackwell Ultra产品的服务器。
2. 新一代绘图处理器(GPU)架构“Vera Rubin”将在2026年下半年推出
黄仁勋表示,以天文学家Vera Rubin命名的下一代GPU将于明年下半年推出。Rubin拥有一款新的中央处理器(CPU),其效能是先前芯片的两倍,而且拥有更多内存和带宽。
接着在2027年下半年,英伟达将推出Rubin Ultra,它将包含多个连接在一起的GPU。
黄仁勋表示,英伟达再下一代的GPU架构将被命名为Feynman,预定2028年推出。
3. 首款用于人形机器人的AI模型
黄仁勋表示,英伟达Isaac GR00T N1是世界上首款用于打造人形机器人的开放、可完全客制化的AI基础模型。该公司将利用合成和实际数据对GR00T N1进行预先训练,并且向机器人开发商推出开放模型系列。
英伟达与谷歌、迪士尼合作开发Newton物理引擎,让机器人学习如何更精确地处理复杂的任务。Newton将针对机器人学习进行优化,并与Google DeepMind的MuJoCo和英伟达Isaac Lab等模拟框架兼容。预期Newton物理引擎将于2025年稍晚推出。
4. 代理型AI的推论模型,本质上是“AI工厂的操作系统”
黄仁勋发表Nvidia Dynamo,本质上是“AI工厂的操作系统”,藉此加速和扩展推论模型。Nvidia Dynamo是作为协调与加速数千个的GPU的推论通讯,利用分布式计算特性于大型语言模型的处理与产生分配到不同的GPU,可针对特定需求单独将每个阶段优化,藉此提升AI工厂服务的性能。
黄仁勋他还宣布Llama Nemotron系列推论模型,这将使开发人员和企业能够建立代理型AI。这些新的推理模式是开放的。
5. 个人AI超级计算机
黄仁勋介绍了Nvidia DGX个人AI超级计算机,由英伟达Blackwell AI平台提供驱动。DGX Station和DGX Spark(以前称为 Project DIGITS)将让从开发人员到学生的每个人都能利用桌面计算机制作AI模型的原型、进行微调以及执行运作。
英伟达指出开发DGX Spark 和 DGX Station的全球系统制造商包括华硕、戴尔、惠普、联想。
6. 采用硅光子技术,推出Spectrum-X Photonics和Quantum-X Photonics网络交换器
这类网络交换器可让AI工厂能以连接数百万组GPU加速器的规模运作。AI工厂可跨越不同地点、连接数百万个GPU,发展至前所未有的规模。
在这块领域,英伟达携手台积电、鸿海、日月光投控旗下硅品及波若威等台厂,其他生态系成员还包括Coherent、康宁、Fabrinet、Lumentum、SENKO、住友电工和天孚通信等美、日、中厂商。
7. 英伟达与通用汽车(GM)合作
黄仁勋表示,英伟达正与通用汽车合作,在新一代汽车、工厂和机器人中使用AI。
这项消息冲击英特尔旗下开发自驾技术的Mobileye Global的股价一度重挫逾6%,收盘跌幅收敛至3%左右。
8.英伟达与电信公司合作开发AI原生6G无线网络,做为目前5G网络的后继网络
英伟达正与T-Mobile、MITRE、思科、ODC和Booz Allen Hamilton合作开发AI原生6G无线网络的硬件、软件和架构。电信业者将合作再NVIDIA AI Aerial平台上为6G构建原生网络堆栈。
9. 大型科技公司今年继续采购AI芯片
黄仁勋表示,四大公有云端供货商 ,包括亚马逊、微软、Alphabet旗下谷歌,以及甲骨文,去年购买130万个英伟达老一代的Hopper AI芯片。他说,2025年迄今,四大业者已购买了360万个Blackwell AI芯片。