PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation
论文链接:https://arxiv.org/pdf/1812.11788.pdf
代码链接:https://github.com/zju3dv/pvnet
- 摘要:作者提出一种基于像素投票的网络回归每个像素的指向关键点的单位向量,然后使用RANSAC方法,每个单位向量投票选出关键点位置。这对于定位遮挡和截断的关键点创建了一个灵活的表示,这种表示的另一种重要特征是提供了关键点位置的不确定性从而能够使用PnP求解器进一步求解。
- 引言
通过CNN回归2d坐标然后使用
Perspective-n-Point(PnP)算法计算6D位姿表现很好,但是很难处理被遮挡的物体和被截断的物体。
作者认为处理遮挡物体和截断物体需要密集预测,称为piwel-wise 或者patch-wise estimates。因此,作者提出一个新型的6d 位姿预测的架构-Pixel-wise Voting Network
(PVNet).基本观点如Fig 1.与直接回归图像图标相反,PVNet预测了指向每个关键点的单位向量,然后基于RANSAC方法投票选出关键点位置。这种关键点位置vector-field表示,迫使网络集中在物体的局部特征和各个部分的空间关系,从而根据可见部分推断出不可见部分,另外ector-field表示可见表示物体外的关键点。
该方法的另外一种