UT Austin朱玉可：人形机器人的数据困局怎么破？答案藏在「数据海绵」里｜ICRA 2026

TL;DR · 一句话结论

朱玉可提出三层数据金字塔（互联网视频、合成数据、真实数据），以世界模型作为数据海绵。已开源GR00T基础模型、SONIC全身控制器及EgoScale训练框架，并发布H2 Plus参考平台。

雷雷峰网2026年6月4日 15:08约 2 分钟阅读↗ 查看原文

主要内容

人形机器人从Demo到大规模部署的核心瓶颈是数据。真实数据稀缺，仿真数据存在Sim-to-Real gap。朱玉可团队（UT Austin + NVIDIA GEAR）探索利用互联网人类视频和动作捕捉数据来规模化训练，并引入世界模型生成虚拟轨迹。

对AI工具用户和开发者：开源GR00T、SONIC、EgoScale等模型可直接用于机器人控制或二次开发；数据金字塔策略可降低真实数据采集成本，加速人形机器人应用落地。世界模型生成数据的方法可能影响其他具身智能训练范式。

🇨🇳

对中国用户与市场

国内人形机器人厂商（如宇树、傅利叶等）可复用开源控制器和训练框架。但需关注NVIDIA GPU依赖和仿真平台Isaac的合规性。中文互联网视频数据可能受限，需自行采集或使用国产替代方案。

⚠尚未确定的部分

→可采取的行动

不应押注单一数据源，而应以异质方式汇集三种数据。

让世界模型扮演'数据海绵'的角色，吸收并整合所有类型的数据。

#UT Austin#NVIDIA GEAR#GR00T#SONIC#EgoScale#DreamZero#Isaac#H2 Plus#人形机器人#数据金字塔

🤖 本文根据雷峰网的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。