中国新闻网-上海新闻
上海分社正文
0门槛、0代码开发机器人新动作 智元“灵创”平台上线
2025年10月24日 17:04   来源:中新网上海  

  中新网上海新闻10月24日电(记者 李姝徵)2025年10月24日,程序员节这一天,智元机器人正式推出全球首个0代码、0门槛的机器人内容创作平台——“灵创”平台。该平台以“让创作更简单,让表达更灵动”为核心理念,首次将AI动作捕捉、云端模仿学习与多模态编排能力深度融合,面向普通用户开放人形机器人内容创作的无限可能。

  无需编程基础、无需专业设备,只需上传一段人类动作视频,用户即可通过“灵创”平台实现从真人表演到机器人精准复刻的端到端转化。从此,每个人都能成为机器人的“导演”和“编舞师”,轻松打造属于自己的机器人表演作品。

  动作模仿:0门槛、0代码开发机器人新动作

  长期以来,人形机器人的动作开发依赖复杂的流程——包括专业动捕设备、算法建模、强化学习训练与工程调参,技术壁垒极高。绝大多数终端用户因缺乏编程或机器人控制知识,难以真正参与内容创作。

  “灵创”平台的诞生彻底打破了这一壁垒。通过AI视觉动作提取、智能重定向算法与高效云端模仿学习框架,平台实现了人类行为到机器人控制策略的自动化生成。无论是舞蹈、武术还是日常交互动作,用户只需一部手机拍摄视频上传,即可让机器人“学会”并精准演绎。

  值得关注的是,“灵创”平台的动作模仿功能,不仅可以完成肢体动作复刻,未来也可以实现手指级别精细动作的模仿与展现。

  语音演绎:匹配语音智能生成 音色情绪百变可调

  除根据视频模仿生成动作外,“灵创”平台还为用户提供了“语音演绎”功能,该功能为用户提供了音频上传、在线录音和语音合成三种模式。

  用户上传文本内容或音频后,“语音演绎”功能会智能识别语义,并利用多模态大模型生成与语音内容匹配的机器人肢体动作与表情,从而实现自然拟人表达。

  “语音演绎”的语音合成为用户提供了音色、情绪可定制化能力,系统提供了男性、女性以及自定义音色类型,用户可以自由选择自然生动的音色、情绪表达,能够保证机器人的语气更贴近场景,提升机器人动作、语音和表情演绎表达时的情感力与沉浸感。

  时间轴编排:AI助力用户做导演 精确控制每一帧

  情感力、沉浸感在机器人的商业表演、商场导购及商务接待场景中至关重要,除此之外,这类场景通常还需要能够完成连贯、持续的长程展示任务,这需要机器人具备多动作组合创作能力,智元机器人“灵创”平台产品团队将其称之为“机器人故事片”式创作。

  为了提升用户创作“机器人故事片”的能力,“灵创”平台打造了动作混剪、组合与故事线编排功能,帮助用户做“导演”,让用户像剪视频一样,完成长程表演中的叙事化动作设计。

  该功能支持用户利用多个动作,像剪辑视频一样编排机器人声音、动作与表情,精准控制每一帧动作节奏,为机器人设计丝滑过度的连续动作组合展示,堪称机器人动作设计领域的“剪映”。

  群编群控:一键群控多机协作 海量素材随心用

  目前,商演服务是机器人常见的落地应用场景之一,实际表演中,往往需要多台机器人配合完成。“灵创”平台的“设备联动与群控管理”功能,在传统机器人批量协同统一表演的基础上,支持多设备、多样化动作任务一键下发,实现多台机器人群编群控,分角色以不同动作、不同语音、不同表情协同演绎。

  除了利用视频、音频帮助用户开发动作外,为了提升用户创作效率与便捷性,“灵创”平台为用户提供了官方素材库,涵盖11类场景超过180套标准化动作与140套表情模板,用户可以从素材库中直接调用动作、表情进行动作组合创作。

  不仅如此,用户利用动作模仿、语音演绎设计的创意作品,还可以一键分享到创意广场,让创意灵感被更多用户发现、使用。

  人形机器人在 2025 年实现了突破式发展,从拟人步态、舞蹈、武术到特技动作,在行为表达能力方面的呈现越发丰富。智元机器人推出“灵创”平台,把接口开放给大众,重新了定义机器人内容创作形式、效率,将进一步提升机器人行为表达的丰富性。

  智元机器人“灵创”平台已经适配智元旗下的灵犀 X2 机器人,未来将进一步扩展至远征A2等多类型、多形态机器人产品。(完)

注:请在转载文章内容时务必注明出处!   

编辑:李秋莹  

本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
常年法律顾问:上海金茂律师事务所