英伟达发布Cosmos 3:全球首款全开源物理AI模型,物理AI时代加速到来

AI资讯2小时前发布 EdgeClaw
84 00

在2026台北GTC大会上,英伟达正式发布重磅产品——NVIDIA Cosmos 3。这款面向物理AI的开放世界基础模型,凭借全新混合Transformer架构,打通视觉推理、世界生成、动作预测三大核心能力,成为全球首款完全开放的全模态物理AI模型。英伟达同步牵头成立全球开发者协作联盟,正式宣告物理AI规模化落地时代加速到来。

与当下主流聚焦内容创作的多模态大模型不同,Cosmos 3的核心定位精准锚定真实物理世界,原生支持文本、图像、视频、环境音、动作五大模态的理解与生成,且具备顶尖的物理规律精准度。英伟达创始人兼CEO黄仁勋在主题演讲中直言:「物理AI时代已经到来——未来每一家工业企业都将成为机器人公司」。

NVIDIA Cosmos 3机器人与AI芯片融合展示物理AI技术突破

Cosmos 3采用由推理Transformer与生成Transformer组成的双模块架构。推理模块负责先理解场景中的物体交互、运动规律及时空关系;生成模块则在此基础上,输出完全符合物理规律的视频画面与动作轨迹。这种设计使模型能够先理解现实世界中的物理互动,再生成对应的画面和行为结果,从而显著提升对复杂环境的建模能力。

最关键的是,Cosmos 3彻底重构了物理AI的开发效率。英伟达指出,将传统需要数月的训练和评估周期,直接压缩至数天,同时支持单帧输入生成30秒符合物理规律的视频序列,动作预测延迟控制在10ms内。这意味着机器人、自动驾驶汽车和视觉AI智能体在真实环境理解方面的研发门槛将大幅降低。

AI世界模型概念图虚拟数字世界与现实物理世界融合场景

为满足不同开发者的需求,英伟达推出了多梯度产品版本,并将模型权重、源代码及评测数据集全量开放:Cosmos 3 Nano面向边缘设备实时推理,Cosmos 3 Standard是面向开发者的主力型号,Cosmos 3 Super则面向车企和人形机器人企业用于大规模数据合成。

产业端已有大量头部企业率先入局落地。在机器人领域,三星、LG电子、Doosan Robotics、Agile Robots等知名厂商已加入;在智能汽车领域,理想汽车已依托该平台开展相关技术研发。这意味着物理AI正在从实验室走向商业化应用,一个全新的产业风口正在形成。

智能汽车与机器人手臂展示自动驾驶与具身智能技术

当AI从「数字世界」迈向「物理世界」,一场新的产业革命正在酝酿。Cosmos 3的发布不仅是英伟达的技术里程碑,更是整个AI行业从虚拟内容生成迈向物理世界智能落地的关键转折。

© 版权声明

相关文章