6DoF Object Pose Estimation via Differentiable Proxy Voting Loss论文理解
论文链接:arxiv
解决什么问题
6Dof估计,优化了投票
本文创新点\贡献
提出了一个新的loss,可以将距离因素也考虑进去,根据投票方向、像素和被投票关键点的距离一起来优化结果,收敛还很快
本文IDEA来源
投票方法在遮挡和视角改变上都有鲁棒性,所以也是基于投票来做的
方法
不需要微调,先投票2D关键点,关键点用了两种loss:一是方向,二是距离;然后pnp解出pose
方向向量的投票
作者的预测使用了很大的感受野,覆盖了物体的大部分,这样即使有些关键点看不见了,也能从可视部分推导出来
那不知点云是否有效
mask和投票向量的表达和PVN3D是一样的,方向向量用smooth L-1 loss来回归:
L v f = ∑ k ∈ K ∑ p ∈ M l 1 ( ∣ ∣ u k ( p ) − v k ( p ) ∣ ∣ 1 ) L_{vf} = \sum_{k\in K}\sum_{p\in M} l_1 (||u_k( p) - v_k(p)||_1) Lvf=k∈K∑p∈M∑l1(∣∣uk(p)−vk(p)∣∣1)
其中 v k ( p ) v_k(p) vk(p)是估计的方向向量, M M M是物体mask
Differentiable proxy voting loss
来源:
这块是这个论文的总重要的创新点,作者提出这个是因为作者发现发现,如果只是用方向来投票的话,如果投票点和关键点的距离很远的话,即使投票方向误差很小,通过距离来放大之后偏差就很大了,如上图所示, p 1