GraspNetStage1:
Pointnet2Backbone,
输入:N*3大小的点云数据
输出:具有C通道特征的点,并进行了一次M个点的子采样 M*(3+C)
ApproachNet
将可行逼近向量分为V个预定义视点。
输出:两个值来预测其是否可抓取的置信度。因此,我们的proposal生成网络的输出为M × (2 + V),其中2表示可抓取或不可抓取的二进制类,V表示预定义的接近向量个数。
GraspNetStage2:
CloudCrop(64, 3, cylinder_radius, hmin, hmax_list)
在圆柱体区域中分组点
输入: seed_xyz: 种子点坐标
点云:要裁剪的点
vp_rot: 从接近向量生成的旋转矩阵
输出:不同深度分组点的特征
Cylinder Region Transformation
为每个抓握候选建立统一的表示形式
由于接近距离相对来说不那么敏感,我们把它分成K个箱子。距离dk
OperationNet
进一步预测平面内旋转、接近距离、抓爪宽度和抓爪置信度
self.conv1 = nn.Conv1d(256, 128, 1)
self.bn1 = nn.BatchNorm1d(128)
relu
self.conv2 = nn.Conv1d(128, 128, 1)
self.bn2 = nn.BatchNorm1d(128)
relu
self.conv3 = nn.Conv1d(128, 3*num_angle, 1)
输出是k*R*3(分成K个箱子,R个旋转度)
ToleranceNet
提出了一种被称为抓取亲和域(GAFs)的表示,以提高我们的抓取姿态预测的鲁棒性。由于可行的抓握姿势是无限的,人类倾向于选择能够容忍更大错误的抓握姿势.
输出是k*R*1(分成K个箱子,R个旋转度)