中新网上海新闻5月15日电(范宇斌)上海首家人形机器人量产企业“智元机器人”14日发布消息称,智元机器人联合香港大学推出一个具备跨机器人本体、场景与任务泛化能力的通用策略学习系统(即UniVLA)。
智元机器人相关负责人介绍:“想象一下在不远的未来,通用机器人真正走进了日常生活。我们希望当你发出一条自然语言指令,无论是‘帮我给猫喂食’,还是‘帮我关掉台灯’,它都能够理解你的意图,并准确地完成动作——不依赖预定义的任务模板,也不受限于曾经训练过的数据分布。”
然而,现有的机器人系统往往依赖人工标注的数据与固定的动作空间,面对那些未被明确训练过的任务或非典型场景,它们常常会因为“未见过”“无定义”而选择拒绝执行,严重限制了通用性的发挥。
有没有一种能够从更广泛的数据来源,如从互联网上的人类视频中学习动作的方法,并实现多种场景、任务的真正通用和泛化呢?UniVLA作为跨本体、跨场景、跨任务的通用策略学习系统,就像为机器人安装了“跨界大脑”。
据介绍,UniVLA不再直接预测每一步动作,而是构建以任务为中心的隐式动作空间,可充分利用语言描述与视频示范进行策略学习,实现从“看视频”“听指令”到“动手操作”的通用控制,同时也能以更低的计算资源消耗实现更优的效果。
UniVLA不仅代表视觉语言动作模型领域的一次突破,更为“通用机器人智能”提供了新的思考与贡献:从像素重建走向语义解耦的隐式动作学习、从高耗能预训练走向轻量高效的跨本体适配、从单一机器人数据闭环走向人类视频与多本体数据的开放协同。(完)
注:请在转载文章内容时务必注明出处!
编辑:王丹沁