机器人能轻松抓取水果等物品。
6月24日,成都人形机器人创新中心发布了中国首个基于视觉扩散架构的人形机器人任务生成式模型R-DDPRM,该模型能让机器人毫不犹豫“丝滑”地处理各种复杂任务,这是人形机器人进化史上的重大核心技术突破。
“成都人形机器人创新中心致力于打造具有国际领先水平的‘有脑子’的人形机器人。”成都人形机器人创新中心有限公司负责人张睿睿表示:“此前大家所熟知的一些模型是基于扩散架构的垂直模型,它们无一例外都拥有强大的理解、推理和生成能力。扩散架构应用于人形机器人核心技术研发是全球人工智能最新最尖端领域,将重构人形机器人底层架构,释放人形机器人的决策技能,使其在操纵和泛化方面达到前所未有的高度。目前全球范围内仅特斯拉、麻省理工+哥伦比亚大学联合团队等人形机器人国际顶尖团队发布了相关阶段性成果。”
“目前业界的人形机器人任务生成式模型主要基于VAE、AC Transformer、LSTM等架构,但这类架构下的人形机器人通常在规划动作时考虑单一约束类型,例如物体抓持稳定性或规避障碍物路径规划,这就需要针对每种细分情况都要对应开发和执行一系列单独的垂直模型(并联线性),遇到执行问题需要局部调整试错来缓慢推进任务进程,推理效率低、执行速度慢且大量消耗算力。”张睿睿介绍,成都人形机器人创新中心首发的R-DDPRM模型能够让人形机器人跨越多个约束进行泛化,创造了真正的人形机器人“大脑”——能够毫不犹豫“丝滑”地处理各种复杂任务。
该模型具有同时确定拿起物体的最佳抓持位姿、移动物体最佳路线、能耗最少最佳等多要素全局规划思维能力。而且能够在人为破坏任务进程时迅速进行决策修正和调整执行方式,接续完成任务,该模型的泛化能力能让人形机器人自主流畅完成从整理房间到复杂外科手术等各种复杂任务。
据介绍,R-DDPRM任务生成式模型具有更加稳定、任务执行成功率大幅提升、决策更敏捷、算力依赖度几何级降低(理论上中等消费级显卡在端上即可完成人形机器人绝大部分任务)、处理复杂场景任务的能力更强等绝对优势,将极大提升人形机器人的任务执行能力和效率,降低算力和能耗成本。
“此次R-DDPRM的发布,将实现人形机器人在任务生成上从并联线性推理到敏捷全局泛化推理的质的飞跃,这是人形机器人领域的突破性成果,将重新定义人形机器人推理和任务规划的底层逻辑。”张睿睿说。