论文链接:https://arxiv.org/abs/2011.12001
代码:https://github.com/qq456cvb/CanonicalVoting
VoteNet通过主干网络传递输入点云,然后对一组种子点进行采样,生成中心投票。然后,通过可学习的模块聚合投票簇,生成包围框朝向和大小。
这种逐点预测绝对偏移和包围盒方向,某些情况下甚至不如随机猜测。
为了解决这个问题,作者将直接预测偏差分解为了三个部分:局部标准坐标,包围盒尺寸,包围盒朝向。 首先估计局部标准坐标和包围盒的规模,并通过标准投票算法寻找欧式空间中可能的对象朝向和中心。对象包围盒由高票位置得出。但是,这种详尽的方向搜索会带来一些投票的错误积累,为了消除假阳,设计了一个LCC反向投影检查算法来将提出的对象坐标反投影到标准空间,与预测的局部标准坐标进行对比。
贡献:
Bypassing orientation regression difficulties through
Local Canonical Coordinates and Canonical Voting.Devising a back projection validation module to elimi-
nate false positives, achieving high average precision.State-of-the-art performance on three 3D bounding box
detection benchmarks.
3.1 overview
3.2 回归局部坐标
受到 He Wang, Srinath Sridhar, Jingwei Huang, Julien Valentin,
Shuran Song, and Leonidas J Guibas. Normalized object
coordinate space for category-level 6d object pose and size
estimation. In Proceedings of the IEEE Conference on Com-
puter Vision and Pattern Recognition, pages 2642–2651, 2019.启发
提出回归局部标准坐标,局部标准坐标定义在定义为单位立方体内的3D空间,{xyz}∈【-1,1】 ,在局部标准坐标中,模型被一致对齐居中。
局部坐标系与世界坐标系的转换关系
回归局部标准坐标和包围框规模,损失函数:
局部标准坐标回归与直接偏差回归的比较,左边,当图像旋转时,鸭子的不同部位被映射到相同的输出偏移, 直接偏移不会随着旋转变化,使得基于不同输入模式识别不同的偏移量变得困难,相反,LCC回归如右图所示,无论图片如何旋转,属于同一部分的模式在标准始终被映射到相同的局部标准坐标,使得学习输入和输出的关系变得更加容易。
3.3 带有对象性的标准投票
标准投票算法生成投票图指示对象存在的可能性,同时采用对象性分数过滤掉不属于任何对象的投票。通过预测的包围盒规模,标准局部坐标,对象性分数,每个点对于任意可能的旋转方向投票对应包围盒中心,为了累计投票,将连续的欧式空间离散为预定义的H*d*w栅格。同时用Gobj和Gscale记录航向角和包围盒尺寸。
每一点都参与了标准投票过程。 votenet采用分组与下采样方法生成候选,使得遮挡对象容易被忽略
3.4 反向投影局部标准坐标检查及包围盒产生
识别投票图的峰值,并产生包围盒。
使用反向投影的局部标准坐标检查
由于详尽的方向搜索,会有假阳出现在投票图。首先根据投票图的峰值产生包围盒候选,然后将包围盒候选内的点反投影到局部标准坐标,然后检查候选框内的点投影的局部标准坐标p~‘与预测的局部标准坐标p~是否一致。
包围盒中心根据投票图的峰值产生,直到峰值小于某个值,读取对应位置的包围盒规模和航向角。