机器人也会双手互搏了

请点击TomRobot


Robot

Robot

:D

今天为大家带来一种全新的机器人抓取训练方法,基于对抗的方式来对机器人进行训练,能达到更高的准确率和更鲁棒的结果。

这一工作由卡耐基梅隆大学google research机器人部门的研究人员共同完成。





1

 Robot Adversaries for Learning Tasks

训练机械手对不同的物体进行抓取是一件十分困难又漫长的工作,需要大量的训练样本和上千个小时的训练时间。机器人学家们在机器学习的帮助下利用自监督学习的方式训练机器人进行端到端的抓取。

但是还是需要花好长的时间。而且机械臂并不一定是用最好的方式抓到物体,就像这样。


有时候抓取很不稳定,要是一不小心就掉了,机器人会很无奈。工作那么忙怎么能出错呢。

为了进一步节约训练机器人的时间并提高抓取的稳定性(毕竟机器人给你拿东西的时候摔了可就不好了,砸到花花草草也不好),研究人员在对抗学习思想的启发下,提出了一种基于对抗的机器人抓取训练架构。


它是这么工作的,举个栗子;你小时候在学习走路或者骑自行车的时候,在崎岖不平的地面上或者是晃荡的车上学会了走路或者骑车之后,你保持平衡的能力就更加高超,你的技能一定比其他小伙伴更厉害,面对平常的情况就毫无压力了。或者你在学走路的时候老有人来推你,你就必须学会更好的平衡才能保证自己不摔倒,这样你的走路技能就更强更稳定。


我们把这个思想放到机器人的对抗训练中来看,机器人在抓取的时候,以前的算法是一次又一次的抓呀抓呀;


而现在通过两种方式来对扰乱机器人的抓取,首先是摇晃它让他抓不稳;

其次是用另一只机械臂来抢它的东西,打乱它的抓取;


在这样的环境中长大,这只机器人就需要学会抓的更稳,用更好的方式抓才不会把东西弄掉,免得被主人罚站。。。


通过这个你来我往的对抗训练,机器人的抓取技能就会越来越高,无论怎么摇晃,或者其他小伙伴捣蛋它都能稳稳的抓着自己的东西。

成功率从以前的68%提高到了82%而且训练时间和样本都大大减少了。


这应验的一句老话,逆境使人成长,逆境使机器人成长~~~


最后需要说明一下机器人如何从图片中识别抓取的过程,无论是训练的还是捣蛋的机器人,都会利用卷积神经网络来识别图像并选择抓取的角度。

并从18(0-170)个角度的抓取中找到一个最好的角度去抓取。

有成功的也有失败的抓取~~


而这个捣蛋的机器人有九个抓取点,共36种抓取方式,花式捣蛋:



最后让我们来看看机器人如何在逆境中变得更强吧:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值