首页 > 机器人资讯 > 花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习

花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习

日期:2020-06-15   人气:  来源:互联网
简介:想要在现实世界的 机器人 身上探索强化学习(RL),并非易事。 首先,你得拥有类似这样的机器人平台: 而像这样的一只PR2,售价高达40万美元(约合人民币286万元)。 这就足以让很多刚刚起步,或者正想涉足RL/机器人学研究的小型实验室望而却步了。 不过现……

  想要在现实世界的机器人身上探索强化学习(RL),并非易事。

 

  首先,你得拥有类似这样的机器人平台:
 


 

  而像这样的一只PR2,售价高达40万美元(约合人民币286万元)。

 

  这就足以让很多刚刚起步,或者正想涉足RL/机器人学研究的小型实验室望而却步了。

 

  不过现在,谷歌正在试图让这件事变得更简单,更便宜。

 

  比如这样一只三指机器人:
 


 

  价格仅3500美元(约合人民币2.5万元)。

 

  还有这样一只四足机器人:
 


 

  价格4200美元(约合人民币3万元)。

 

  并且,还有相应的开源代码,和精心设计的基准测试作为配套。

 

  这就是谷歌的ROBEL基准。这项研究登上了CoRL 2019。

 

  ROBEL

 

  ROBEL由两只机器人组成,适用于不同的强化学习研究任务。

 

  三指手形机器人,名为D’Claw,擅长学习灵巧操作任务。
 


 

  D’Claw执行任务的过程中有三种常见的操纵行为。

 

  姿势,KUKA机器人电路板维修,适应不同环境的形状。

  旋转,将物体旋转到指定的角度。

  以及拧紧。

  四足机器人,名叫D’Kitty,是只小猫咪,擅长学习敏捷移动。
 


 

  它的三种基准测试动作,是站立,定向和行走。

  机器人的设计都基于现成的组件和常用的原型制作工具(3D打印或激光切割),模块化,易于组装,易于维护。

 

  即使你对硬件并不在行,也仅需要几个小时的时间,库卡机器人何服电机维修,就能构建完成。

 

  ROBEL还为所有这些基准测试任务提供了模拟器,有助于研究人员进行算法开发和快速原型设计。
 


 

  可复现,很鲁棒

 

  听上去便宜好用的ROBEL,到底靠不靠谱呢?

 

  迄今为止,谷歌已经对其进行了长达14000多个小时的训练。

 

  实验证明,ROBEL能够胜任多种机器学习算法。
 


 

  并且,两个不同的实验室分别对ROBEL进行了“试用”。仅使用ROBEL的设计文件和装配说明,两个实验室都成功复现了ROBEL的两个硬件平台。

 

  两个实验室都对自己组装起来的ROBEL进行了基准任务测试。

  两条训练曲线几乎重合。也就是说,在不同地点建造的两只机器人,机器人维修,不仅表现出了相似的训练进度,并且最终都收敛到了同一性能水准。

 

  还真是便宜又好货啊。

免责声明:本网部分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的。如转载稿涉及版权等问题,请立即联系网站所有人,我们会予以更改或删除相关文章,保证您的权利。

相关阅读: