2020.10.14重读 PVNet:Pixel-wise Voting Network for 6DoF Pose Estimation

1.背景信息

  1. 输入单张RGB图像
  2. 隔壁实验室的成果
  3. 最大的亮点:
    (1)证明了两阶段(先求关键点再用PnP求解位姿)比end to end的方法具有优势。直接求解非线性旋转空间,会带来优化上的困难。
    (2)使用unit vector filed来表示方向特征,这被证明是更利于学习和优化的。这里没有用offset,失去了特征大小信息,我觉得是个可以改进的地方。
    (3)使用dense的方法,pixel-wise预测unit vector,并且用基于RANSAC的投票方法进行投票。
    (4)改进的PnP,在PnP公式中引入了不确定性,协方差矩阵,使得位姿估计更准确。

2.方法

在这里插入图片描述
在这里插入图片描述

2.1基于投票的关键点定位

预测逐像素方向的好处:
增强网络关注更多目标局部特征的能力
可以表示优于遮挡和截断不可见的关键点

流程:

  1. 预测每个点相对于第k个关键点的vector:
    在这里插入图片描述
    这里的 x k x_{k} xk显然是最本质的预测值。

  2. 对第k个关键点,随机选择所在目标中的两个点p1,p2,计算 v k ( p 1 ) v_{k}(p1) vk(p1) x k ( p 2 ) x_{k}(p2) xk(p2)方向的交点,将其记为假设 h k , i h_{k,i} hk,i,这样进行N次,就可以得到一个假设集:在这里插入图片描述
    这个假设集中就包含了可能的关键点位置,这是RANSAC方法在这里的应用。

  3. 对每个假设 h k , i h_{k,i} hk,i计算投票分数 w k , i w_{k,i} wk,i
    在这里插入图片描述
    我个人的理解,并举了个例子:
    在这里插入图片描述

  4. 计算第k个关键点预测假设的统计量
    在这里插入图片描述
    关键点选择:FPS,K=8
    **handle多个实例:**语义分割+中心点预测=实例分割

2.2不确定性驱动的PnP

PnP+confidences:
在这里插入图片描述
这个公式添加了协方差矩阵,考虑了信息的不确定性。

原始PnP公式:
在这里插入图片描述

3.实现细节

在这里插入图片描述
FCN具体实现:
在这里插入图片描述
具体有三点不同,我没细究。
训练loss:
在这里插入图片描述
实验结果略。

4.读后感

1. 应该将一些公认测试有效的好的模块和思想集成起来,以期待得到更好的效果。
2. PVNet用的unit vector只取方向信息,而忽略了向量大小的信息。虽然理论上多加信息会有助于性能提升,但是作者这样选择,有可能是加了向量大小的信息在实现上性能会退化。
3. 输出 H ∗ W ∗ ( K ∗ 2 ∗ C ) H*W*(K*2*C) HW(K2C),这里将C引入的原因是这个预测vector的分支还没有接受到语义信息,个人猜想将语义分割的结果引入到vector预测中会提升性能。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
clean-pvnet是一个用于6DoF姿态估计的代码库,它是基于“PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation”论文开发的。如果您想要下载clean-pvnet代码并配置环境,可以按照以下步骤进行操作: 1. 使用命令`git clone https://github.com/zju3dv/clean-pvnet.git`下载代码。 2. 配置环境,可以使用以下命令: ``` conda create -n pvnet python=3.7 conda activate pvnet conda install pytorch==1.5.0 torchvision==0.6.0 cudatoolkit=10.2 -c pytorch pip install Cython==0.28.2 sudo apt-get install libglfw3-dev libglfw3 pip install -r requirements.txt ``` 这些命令将创建一个名为`pvnet`的虚拟环境,并安装所需的依赖项。 3. 当您运行`run.py`时,输出日志将显示运行的进度和结果。根据提供的日志,运行看起来是成功的,并输出了一些信息。 4. 对于权重文件,根据提供的信息,训练好的权重文件可能存储在代码库的某个目录中。 请注意,这只是对clean-pvnet的简要介绍,如果您需要更多详细信息或有其他相关问题,请参考论文和代码库中的文档。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [【复现笔记】clean-pvnet复现](https://blog.csdn.net/weixin_54470372/article/details/128293400)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值