机器人抓取检测——Dex-Net

如今,在各种期刊顶会都能看到平面抓取检测的论文,他们声称能应对多物体堆叠场景,然而实际效果都不尽人意,我认为主要原因有如下几点:

  1. 缺乏多物体堆叠场景的抓取数据集。现在最常用的Cornell Grasp Dataset, Jacquard数据集都是单目标场景。(像Dex-Net数据集和Google机器人工厂这种东西普通研究者就只能看着了)
  2. 现在的研究者过于强调端到端检测。
  3. 没有一个合适的抓取表示法。

如何利用少量数据集学习一个端到端网络或者整个方法中的一个子网络,实现堆叠场景中的平面抓取检测亟待解决。这里所说的堆叠场景是下左图,而不是大多数论文所说的右图:

简单说一下Dex-Net系列算法。Dex-Net共包括1.0--4.0四个版本,1.0为传统的解析法。2.0基于深度学习对平行板抓取配置进行质量评估,3.0针对吸盘进行设计,4.0结合了2.0和3.0两个算法。

算法输入为深度图,输出为平面抓取表示,即坐标点和抓取角,然后张开平行板抓取器至最大并垂直抓取。

算法主要包括两部分:采样抓取候选,抓取质量评估。

  • 采样抓取候选:从给定深度图中采样很多个候选的抓取配置——采用cross entropy method
  • 抓取质量评估:评估上一步每个抓取配置的质量[0,1],然后输出质量最高的抓取配置作为Grasp candidates,如下图。
  • 其中,第一步采用的传统方法,第二步采用的深度学习,为了训练这个网络,作者生成了一个包含670万个样本的数据集。为了完成两个阶段的衔接,神经网络的输入也不能是传统的深度图,而是经过精心设计裁剪后的深度图。整个算法最妙的地方在于突破了传统的抓取思路:端到端地抓取检测,直接预测最优的抓取配置。 

Dex-Net2.0采用的抓取表示为(x,y,theta),其中(x,y)为抓取点在深度图中的坐标,theta为抓取方向,在抓取时,抓取手张到最大然后垂直抓取,如下图:

抓取质量评估

 为了完成两个阶段的衔接,输入神经网络的数据就不能是传统的深度图,而是以抓取点为中心,抓取方向水平的一个深度图像块,下面详细介绍:

经过第一阶段,得到了很多个(x,y,theta)。既然是评估每个(x,y,theta)的质量,就必须把(x,y,theta)和深度图像都做为网络的输入,那么以何种方式输入呢?作者给的方案是:以抓取点(x,y)为中心,将深度图像旋转theta角,使抓取方向与图像的水平轴平行,然后以抓取点(x,y)为中心,切出一块32*32大小的深度图块,将这个深度图块输入网络,除此之外,还将抓取点(x,y)相对于桌面的高度z作为另一个输入。如下图。

采集数据集

从Dex-Net1.0中筛选了1500个3D物体模型(Dex-Net1.0是一个3D物体模型及抓取数据集),对其中的每个物体,采取同样的操作:将物体随机放在虚拟桌子上,获取当前状态下的垂直抓取表示即(x,y,theta)(可从Dex-Net1.0的标注中直接生成),这些抓取有些是可以用于实际抓取的,有些无法用于抓取。然后使用虚拟深度相机拍摄深度图,然后对每个抓取表示执行和2.1网络输入同样的操作,就得到了670万个正负样本,如下图:

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DEX-Net(Dexterity Network)是一种用于机器人抓取训练的方法,它旨在教会机器人如何在复杂的环境中高效地抓取物体。下面是对DEX-Net的详细介绍: 1. 抓取姿态表示:DEX-Net使用一种称为抓取姿态表示的方法来描述抓取物体时的姿态。抓取姿态表示包括物体的3D几何信息和机器人抓取器的状态,例如抓取器的位置、朝向和打开程度等。这个表示可以帮助机器人预测在不同姿态下抓取成功的概率。 2. 数据集收集:为了训练DEX-Net,需要收集大量的数据集来包含各种不同的物体和抓取姿态。通常使用深度相机来获取物体的3D几何信息,并记录机器人执行抓取动作的状态。可以通过人工控制机器人进行抓取或使用自动化方法来生成数据集。 3. 数据标注和预处理:收集到的数据集需要进行标注和预处理。标注包括为每个抓取姿态分配一个二进制标签,表示抓取成功或失败。预处理可能包括将3D几何信息转换为适当的表示形式,例如点云或体素网格。 4. 网络训练:使用标注和预处理后的数据集来训练神经网络模型。通常使用深度学习方法,如卷积神经网络(CNN)或递归神经网络(RNN),来学习抓取姿态表示与抓取成功概率之间的关系。训练过程中,优化算法将调整网络参数以最大化预测的准确性。 5. 抓取规划:训练完成后,可以使用训练好的模型来进行抓取规划。机器人可以通过查询模型来预测不同姿态下的抓取成功概率,并选择具有最高成功概率的抓取姿态进行执行。 总的来说,DEX-Net是一种基于深度学习的方法,用于训练机器人在复杂环境中进行高效抓取。它通过收集大量数据集,标注和预处理数据,并使用神经网络模型进行训练,实现了对抓取姿态和成功概率之间的关系建模。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值