热门AI应用案例
CVPR 2026现场直击:CV与机器人的物理结界被彻底打破
主要内容
- 01小米获GigaBrain真机赛道冠军(成功率40.89%)。
- 02特斯拉披露FSD上下文长度提升至30秒。
- 03小鹏第二代VLA已量产,用户辅助驾驶占比超50%。
- 04中国团队包揽GigaBrain全部四个赛道冠军。
背景
CVPR是计算机视觉领域顶级学术会议,今年与ICRA 2026同期召开,出现学者双城赶场现象。本届核心趋势是从2D感知转向具身智能和物理世界理解,多模态基础模型(VLA、世界模型)成为焦点。
为什么值得关注
对AI工具用户和开发者,这标志着视觉模型从‘看’到‘动’的质变,VLA和世界模型开始落地。华为、小米等企业的量产成果和开源数据集(如Nexdata、Colossal-AI)可直接用于开发。
🇨🇳
对中国用户与市场
中国高校和企业在CVPR 2026主导多项成果,小米、小鹏等产品已商用。国内开发者可关注国产具身智能数据集和Colossal-AI等开源系统,但需注意部分技术仍处于实验阶段。
继续关注
⚠尚未确定的部分
- ·VLA模型在复杂场景泛化性仍有限,40%成功率仍低。
- ·国内具身智能硬件和算法尚未大规模标准化。
- ·中美技术竞争可能影响部分开源资源获取。
→可采取的行动
- ·关注小米‘my16’模型架构及开源计划。
- ·尝试使用Colossal-AI系统进行多模态模型训练。
- ·跟进上海AI Lab系列Workshop论文产出。
- ·测试小鹏VLA模型在自动驾驶中的应用效果。
摘记
VLA与世界模型并非相互竞争的技术路线,而是物理世界基座模型的两大支柱。
只有能做基座模型的公司,才有可能真的做到L4。
#CVPR 2026#ICRA 2026#特斯拉#小鹏#小米#上海交通大学#苏度科技#MiniMax#计算机视觉#具身智能
🤖 本文根据 雷峰网 的 RSS 内容整理,并由 AI 辅助提炼要点。完整上下文请以 原文 为准。