文/VR陀螺 万里
今日上午,英伟达 CEO黄仁勋发表了CES 2025活动演讲。
除了黄仁勋标配的皮衣外,演讲现场一口气丢出了RTX 50系列显卡、AI PC、自动驾驶系统、世界基础模型Cosmos等多个新品/解决方案。
从这场发布会来看,英伟达的AI雄心,其实远不止芯片制造商。
50系显卡全系采用Blackwell架构,升级为PCle 5.0接口、并支持DLSS 4等新特性。现场具体介绍了RTX 5090显卡,它相较4090更贵但也更强了:售价:1999美元,国内建议零售价为16499元。
具体参数方面,RTX 5090拥有920亿个晶体管、21760个CUDA核心、配备32GB DDR7内存,AI算力最高可达2375 TOPS。得益于架构的改进,新款显卡GPU性能基本是上一代显卡的2倍。
此外,发布会中提到,RTX 5070显卡性能可以比肩4090,但售价只有549美元,新一代真香卡预定。
据了解,对于桌面显卡,RTX 5090、RTX 5080 GPU(8299元)将于1月底上市;RTX 5070 Ti、RTX 5070将于2月份上市。对于笔记本产品,搭载GeForce RTX 5090、RTX 5080和RTX 5070 Ti笔记本电脑将于3月上市,RTX 5070系列笔记本将于今年4月上市。
RTX 50系列具体规格信息,图源:网络
文章开头黄仁勋所举着的这个类似盾牌一样的东西是为了展示企业最新的AI服务器互联技术NVLink72。
基于NVLink72,可以将总计72个Blackwell GPU和36个 Grace CPU集中在一块硅基芯片上面,如果按照传统的架构构建同类型产品,那么它的体积可能会跟一个衣柜大小相当。
NVLink72的主要参数特性如下:基于Blackwell框架;可以双向提供1.8TB/秒的总带宽,是上一代产品的两倍;NVLink72的总带宽比PCIe Gen 5高出14倍以上;可以通过NVLink Switch连接多个NVLink72。
Project Digits是英伟达打造的首个AI超级计算主机,该产品作为会上的One more thing推出。
Project Digits外观类似于Mac mini,极为小巧便携,但是里面却配备了一颗GB10 Grace Blackwell超级芯片,AI算力高达1 petaflop,单台设备便可运行包含200B参数AI模型。据悉联发科也参与了GB10的芯片设计工作。
此外,Project Digits配备了128 GB RAM,ROM达到了4TB。主机搭载Grace CPU,其由20个Arm核心构成,并配备了Connectivity、ConnectX NIC等组件。
Project Digits运行Nvidia DGX OS,系统基于Linux构建,里面集成了英伟达的系列AI软件库。产品售价3000美元,并计划于今年5月上市。会上黄仁勋表示,产品适用于“每一位数据科学家、人工智能研究人员和学生,将使他们能够参与和塑造人工智能时代。”
会上推出了两款全新AI模型,其中NVIDIA Llama Nemotron是一款大语言模型,它基于Llama基础模型构建而成,使用英伟达的最新技术和高质量数据集进行修剪和训练,以增强代理能力。它们擅长指令遵循、聊天、函数调用、编码和数学,同时经过尺寸优化,可以在各种英伟达加速计算资源上运行。
Llama Nemotron包含了Nano、Super、Ultra三个版本。其中Nano版本针对低延迟的实时应用进行了优化,非常适合部署在PC和边缘设备上。该模型即将免费对外开放下载,或可通过NVIDIA NIM进行调用。
除了大语言模型外,英伟达还首度公布了NVIDIA Cosmos,这是一个由先进的生成式世界基础模型(WFM)、tokenizer、护栏和加速视频处理管线组成的平台,旨在加速自动驾驶汽车 (AV)和机器人等物理 AI系统的开发。
所谓世界基础模型,即一个能理解世界语言、物理特性、空间位置以及因果关系的模型,它是加速智能汽车、具身智能等AI终端普及的关键所在。相较于LLM的蓬勃发展,世界模型仍处于较为早期的阶段。在开发方面,世界模型背后的开发同样涉及到海量的基于现实世界数据的捕获以及训练工作,因而开发成本不菲。
而现在,Cosmos模型采用了开放模型许可证的方式对外提供,可通过NVIDIA API、NVIDIA NGC目录或 Hugging Face下载使用,这对于机器人等领域的开发者而言无疑是一个重要的利好消息。
英伟达Cosmos WFM接受了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据。Cosmos WFM为开发人员提供了一种简单的方法来生成大量基于物理的真实照片合成数据,以训练和评估他们现有的模型。开发人员还可以通过微调Cosmos WFM来构建自定义模型。
黄仁勋表示:“机器人技术的ChatGPT时刻即将到来。与大语言模型一样,世界基础模型是推动机器人和自动驾驶汽车开发的基础,但并非所有开发者都拥有自主训练模型所需的专业知识和资源。我们创建Cosmos是为了普及物理 AI,让每一位开发者都能接触到通用机器人技术。”
据悉,NVIDIA Cosmos的合作伙伴包含了1X、Agile Robots、Agility、Figure AI、Foretellix、小鹏汽车、Uber等机器人及智驾企业。
基于NVIDIA Cosmos,黄仁勋还在会上展示了更多令人眼前一亮的用例,如将它与自家数字孪生平台Omniverse相结合,从而打造出合成数据倍增引擎,开发者可轻松生成大量可控、照片级逼真的合成数据。开发者可以在Omniverse中编写3D场景,并将图像或视频渲染为输出。然后,这些场景可以与文本提示结合使用,以调整Cosmos模型,从而生成无数合成虚拟环境,用于物理AI训练。
对于自动驾驶以及机器人,黄仁勋表示,未来的企业实际上需要用到三套计算系统,其中DGX用于AI模型训练、Omniverse则用于模拟、合成、强化数据,而DGX则是应用于终端的AI芯片。(实际上,这也很好概括了英伟达当前以及后续所聚焦的核心业务)
提到自动驾驶,黄仁勋指出“这可能是第一个价值数万亿美元的机器人产业”,今日他宣布的重磅新闻之一是英伟达将与丰田合作开发自动驾驶汽车。
此外,会上还推出了新一代智驾芯片DRIVE AGX Thor,芯片基于Blackwell架构,算力相较上一代提升20倍。今日极氪宣布将首发该芯片。
NVIDIA DRIVE Hyperion是一个汽车自动驾驶系统,今日黄仁勋宣布系统已经通过TÜV SÜD和TÜV Rheinland的行业安全评估,这是业界首个也是唯一一个端到端自动驾驶平台,目前合作客户包括奔驰、路虎、沃尔沃等。
除汽车外,黄仁勋还公布了面向类人机器人的NVIDIA Isaac GR00T合成运动生成蓝图。目前类人机器人的一个重要领域是模仿学习,即通过观察和模仿人类行为来获得相应的技能。其背后同样涉及到大量繁琐的数据采集工作。
NVIDIA Isaac GR00T分为了三大板块:其中GR00T-Teleop工作流程可以基于Vision Pro在数字孪生中捕捉人类运动数据;而GR00T-Mimic工作流程将捕获的人类演示用以构建更大的合成运动数据集。最后,基于NVIDIA Omniverse和NVIDIA Cosmos平台构建的GR00T-Gen工作流程通过域随机化和3D升级成倍地扩展该数据集。
基于Vision Pro采集操作数据,图源:英伟达
英伟达成立于1993年,2006年推出CUDA,这可视为当前企业AI芯片帝国的重要奠基石。
现如今,英伟达除了显卡以及AI芯片业务外,触角显然延伸到了更远,如正在攻坚的自动驾驶系统,以及具有很强想象空间的Cosmos。
另外我们从黄仁勋在活动现场的频频整活也不难看出,今日的英伟达,依旧朝气蓬勃。