NVIDIA开源世界模型平台Cosmos 3

原标题：NVIDIA/cosmos

GGitHub Trending Daily RSS约 2 分钟阅读↗ 查看原文

主要内容

NVIDIA Cosmos是一个面向物理AI的开源世界模型平台。最新Cosmos 3模型族采用统一的MoT架构，将视觉语言模型、视频生成器、世界模拟器和世界动作模型整合为单一框架。支持文本、图像、视频、音频和动作的多模态输入输出，可应用于机器人控制、自动驾驶仿真、智能基础设施等领域。

Cosmos 3是首个开源的全模态世界模型，能同时理解物理世界并生成多模态内容。对机器人开发者意味着可以直接用同一模型做视觉推理、运动规划、场景生成和仿真训练，大幅降低物理AI开发门槛。其OpenAI兼容API和NIM容器简化了部署。

🇨🇳

对中国用户与市场

国内开发者可通过Hugging Face下载模型权重，但需注意OpenMDW-1.1许可条款。大规模推理需NVIDIA高端GPU（Hopper/Blackwell），可能受出口限制影响模型使用。框架已完成与Qwen3-VL兼容，便于国内生态集成。

⚠尚未确定的部分

→可采取的行动

#NVIDIA#Cosmos 3#Cosmos3-Nano#Cosmos3-Super#Cosmos Framework#Hugging Face#vLLM-Omni#Diffusers#世界模型#物理AI

🤖 本文根据 GitHub Trending Daily RSS 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。