波士顿动力机器狗从真狗中学习运动轨迹及动作-行业资讯-350vip浦京集团

资讯中心

News

波士顿动力机器狗从真狗中学习运动轨迹及动作

2020-04-23 20:27:00

在现实动物界，无论是奔跑着的狗还是在树上摇摆的猴子，动物都可以毫不费力地表现出丰富的敏捷运动技能。但是，设计腿式机器人能够完全复制这些动物敏捷行为的控制器可能是一项非常艰巨的任务。与机器人相比，在动物中看到的卓越敏捷性可能使人们产生疑问：大家是否可以通过直接模仿动物而以更少的精力来创建更多的敏捷机器人控制器？

波士顿动力企业的类人机器人做后空翻或是它的机器人狗狗击退人类并打开一扇门时，你看到的是难以置信的硬件工程。但你看不到的是背后极其复杂的基础代码。对人类来说容易的事情，仅仅只是走路，都需要机器人做极致的协调。
本周发表的一篇预印本论文和博客文章显示，GOOGLE研究人员开发了一款可以学习和模拟动物的动作的AI系统，以赋予机器人更大的灵活性。该论文的合著者认为，他们的方法可以促进机器人的发展，从而让机器人能够完成生活中一些对灵活性要求较高的任务，例如在多层仓库和履行中心之间运输材料。

该团队的框架采用动物（在本例中是狗）的动作捕捉片段，并使用强化学习（reinforcement learning）来训练控制策略，强化学习是一种通过奖励激励App代理完成目标的训练技术。他们从公共数据集中收集运动捕捉视频，然后将数据输入模拟器以创建电子版本的狗。然后，研究人员将数字狗的真实版本转换为他们的四足机器人Laikago的数字版本，该机器人具有矩形的身体和纤细的双腿。然后他们将这些算法移植到Laikago的物理版本中。

研究人员说，为该系统提供不同的参考运动，使他们能够“教”一个四足Unitree-Laikago机器人实行一系列行为，从快速行走（速度高达每小时2.6英里）到跳跃和转身。
为了验证他们的方法，研究人员首先编制了一组真实的狗表演各种技能的数据集。（训练主要在物理模拟中进行，以便能够密切跟踪参考运动的姿势）。然后，通过使用奖励函数中的不同运动（描述了行为者的行为方式），研究人员用大约2亿个样本训练了一个模拟机器人来模拟运动技能。
但模拟器通常只提供对真实世界的粗略近似。为了解决这个问题，研究人员采用了一种自适应技术，该技术可以随机化模拟中的动力学，例如改变物理量，例如机器人的质量和摩擦力。使用编码器将这些值映射到数字表示（即编码），该数字表示作为输入传递给机器人控制策略。当将该策略部署到实际的机器人上时，研究人员移除了编码器，并直接搜索一组变量，这些变量使机器人能够成功实行技能。

该团队说，他们能够在大约50个试验中使用不到8分钟的真实数据来使策略适应实际情况。此外，他们还演示了真实的机器人学习模仿狗的各种动作，包括踱步和小跑，以及艺术家动画的关键帧动作，如动态跳跃转身。
“大家证明，通过利用参考运动数据，一种基于学习的方法能够自动合成控制器，以实现有腿机器人的各种行为。”该论文的合著者写道。“通过将有效的领域自适应样本技术整合到培训过程中，大家的系统能够学习模拟中的自适应策略，然后可以快速将其应用于实际部署中。”
然而，这种控制策略不是十全十美的。由于算法和硬件的限制，它无法学习高度动态的行为（例如大的跳跃和奔跑），并且不如最佳的手动设计控制器那样稳定。（在5种情节中，每种方法总共进行15次试验，现实世界中的机器人在6秒后踱步时平均下降；在5秒后向后小跑时平均下降；在旋转时平均下降9秒）。对此，研究人员表示，将继续改进控制器的鲁棒性，并开发可以从其他运动数据源（如视频剪辑）学习的框架。

这并不是机器人学家第一次寻求动物运动的启发。波士顿动力企业的Spot机器人显然是根据四足动物的流体运动建模的，而其Atlas人形机器人则是根据人的运动建模的。通过精心设计的控制算法，Spot可以从这样的灵感中攀登最困难的地形。
未来的愿景是想让机器人像人类学习那样去学习。意味着必须拥有一个庞大的资料库，已经学习看到了其他人类或动物所做的事情。如果遇到的情况不在库中，则必须在库的各个元素中查找，找到几个看似接近的情况，然后选择最接近的情况，并使用此技巧解决问题。

上一条:医疗机器人制造商Bright Machines研发出新冠病毒自动检测机器人
下一条: 受海星启发，卡内基梅隆大学研发出星型水下爬行机器人