热议中模型发布
UT Austin朱玉可:人形机器人的数据困局怎么破?答案藏在「数据海绵」里 |ICRA 2026
TL;DR · 一句话结论
朱玉可提出三层数据金字塔(互联网视频、合成数据、真实数据),以世界模型作为数据海绵。已开源GR00T基础模型、SONIC全身控制器及EgoScale训练框架,并发布H2 Plus参考平台。
主要内容
- 01朱玉可在ICRA 2026发表主题演讲。
- 02提出数据金字塔:互联网视频、合成数据、真实数据。
- 03世界模型作为数据海绵,吸收异质数据。
- 04SONIC用人类动捕训练全身控制器,开源。
- 05EgoScale用第一人称视频训练,需不到1%真实数据。
- 06DreamZero世界动作模型生成虚拟轨迹等效于真实数据。
背景
人形机器人从Demo到大规模部署的核心瓶颈是数据。真实数据稀缺,仿真数据存在Sim-to-Real gap。朱玉可团队(UT Austin + NVIDIA GEAR)探索利用互联网人类视频和动作捕捉数据来规模化训练,并引入世界模型生成虚拟轨迹。
为什么值得关注
对AI工具用户和开发者:开源GR00T、SONIC、EgoScale等模型可直接用于机器人控制或二次开发;数据金字塔策略可降低真实数据采集成本,加速人形机器人应用落地。世界模型生成数据的方法可能影响其他具身智能训练范式。
🇨🇳
对中国用户与市场
国内人形机器人厂商(如宇树、傅利叶等)可复用开源控制器和训练框架。但需关注NVIDIA GPU依赖和仿真平台Isaac的合规性。中文互联网视频数据可能受限,需自行采集或使用国产替代方案。
继续关注
⚠尚未确定的部分
- ·世界模型生成轨迹的泛化性在复杂场景下未充分验证。
- ·开源模型与国内硬件(如宇树G1)的兼容性需实际测试。
- ·大规模训练依赖NVIDIA GPU,可能受出口管制影响。
→可采取的行动
- ·试用SONIC开源全身控制器,在宇树G1等机器人上部署。
- ·关注EgoScale三阶段训练框架,尝试用中文第一人称视频预训练。
- ·研究DreamZero世界动作模型,评估虚拟数据对国内机器人任务的提升效果。
摘记
不应押注单一数据源,而应以异质方式汇集三种数据。
让世界模型扮演'数据海绵'的角色,吸收并整合所有类型的数据。
#UT Austin#NVIDIA GEAR#GR00T#SONIC#EgoScale#DreamZero#Isaac#H2 Plus#人形机器人#数据金字塔
🤖 本文根据 雷峰网 的 RSS 内容整理,并由 AI 辅助提炼要点。完整上下文请以 原文 为准。