中新网上海新闻6月3日电(记者 李姝徵) 人形机器人产业正迈向全场景虚实交互数据开源的新阶段。上海首家人形机器人量产企业——智元机器人3日正式开源AGIBOT WORLD 2026数据集第二期。
当前,国内人形机器人产业正集体迈入数据基建升级新阶段,多家头部企业、国家级平台纷纷加码具身智能数据集布局,行业数据建设逻辑全面从“收录标准化成功动作”转向“沉淀全场景、全状态真实物理交互数据”。优必选、傅利叶智能、宇树、乐聚、小米、北京人形机器人创新中心等企业密集落地数据集开放、世界模型配套数据基建布局。从全球范围来看,海外特斯拉也同步加码真机交互数据自建储备,行业数据建设逻辑全面从“只收录成功动作”转向“收录全状态真实物理反馈”。
而智元此番开源的AGIBOT WORLD 2026数据集第二期主题为“多样交互(Rich Interaction)”。与此前多家人形机器人厂商开源的数据集不同,这是行业首个聚焦物理交互的开源具身数据集,面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究,系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程,旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。
本期数据集已在Hugging Face平台开放下载。继此前发布以“模仿学习”为主题的第一期数据集后,AGIBOT WORLD 2026进一步将数据建设从专家示范和成功轨迹,推进到真实环境中更复杂、更不确定、也更接近物理世界本质的交互学习阶段。
长期以来,具身智能数据集大多围绕标准任务、专家示范和成功案例展开。然而,真实世界并不总是理想、稳定和可控的。机器人在现实环境中会频繁遇到抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等非标准情境。对于人类而言,这些是日常生活中习以为常的经验;但对于机器人而言,它们恰恰是理解接触、摩擦、重心、形变和反馈等物理规律的关键入口。
为了补齐当前世界模型训练中长期缺失的真实物理交互数据,AGIBOT WORLD 2026第二期“多样交互”数据集应运而生。与传统具身数据集中只关注“成功示范案例”的采集逻辑不同,智元此次开源的“多样交互”主题数据集主动保留并强调非理想行为的研究价值。该数据集基于100%真实场景采集,系统记录了机器人与不同材质、形态和结构物体之间的丰富物理互动,覆盖成功与失败、预期与意外、稳定与混沌等多种交互状态。通过开放这批数据,智元希望为世界模型提供更接近真实世界运行规律的数据基础,推动机器人从“学习如何完成任务”进一步走向“理解动作如何改变世界”。
这些过去常被视为“失败”或“噪声”的数据,正在成为世界模型研究中宝贵的资产。智元机器人方面表示,对于世界模型而言,如果训练数据只包含标准动作和成功示范,模型往往容易停留在对成功状态的拟合上。当面对少见动作、复杂接触和非理想情况时,模型可能难以准确预测真实世界中的失败分布与物理演化。只有见过足够丰富的成功与失败过程,模型才能更好地模拟真实未来场景,减少不符合物理规律的生成结果。(完)
注:请在转载文章内容时务必注明出处!
编辑:谢梦圆






