把GPT-4o拉下神坛！星源智联合北大推出RoboAgent，让3B VLM在未知场景跑出94%成功率

IInfoQ 中文 AI2026年5月29日 19:18约 2 分钟阅读↗ 查看原文

主要内容

大型视觉语言模型（如GPT-4o）在机器人任务中常因计算成本高、泛化能力有限而受限。小参数模型（如3B）在资源效率和部署灵活性上更有优势，但以往性能不足。RoboAgent试图证明小模型也能在未知场景中实现高成功率。

对AI工具用户和开发者而言，这表明小参数模型在特定任务上可能替代大模型，降低部署成本。机器人领域开发者可关注其泛化能力，探索在边缘设备上运行的可能性。

🇨🇳

对中国用户与市场

国内用户可关注该模型的开源可能性，以及是否适配中文场景。若性能可靠，可降低机器人应用对海外大模型的依赖，推动国产机器人技术发展。

⚠尚未确定的部分

→可采取的行动

把GPT-4o拉下神坛

#星源智联#北京大学#RoboAgent#GPT-4o#机器人#视觉语言模型#小模型#未知场景#泛化能力#模型发布

🤖 本文根据 InfoQ 中文 AI 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。