CVPR 2026现场直击：CV与机器人的物理结界被彻底打破

雷雷峰网2026年6月5日 18:47约 2 分钟阅读↗ 查看原文

主要内容

CVPR是计算机视觉领域顶级学术会议，今年与ICRA 2026同期召开，出现学者双城赶场现象。本届核心趋势是从2D感知转向具身智能和物理世界理解，多模态基础模型（VLA、世界模型）成为焦点。

对AI工具用户和开发者，这标志着视觉模型从‘看’到‘动’的质变，VLA和世界模型开始落地。华为、小米等企业的量产成果和开源数据集（如Nexdata、Colossal-AI）可直接用于开发。

🇨🇳

对中国用户与市场

中国高校和企业在CVPR 2026主导多项成果，小米、小鹏等产品已商用。国内开发者可关注国产具身智能数据集和Colossal-AI等开源系统，但需注意部分技术仍处于实验阶段。

⚠尚未确定的部分

→可采取的行动

VLA与世界模型并非相互竞争的技术路线，而是物理世界基座模型的两大支柱。

只有能做基座模型的公司，才有可能真的做到L4。

#CVPR 2026#ICRA 2026#特斯拉#小鹏#小米#上海交通大学#苏度科技#MiniMax#计算机视觉#具身智能

🤖 本文根据雷峰网的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。