CDPN

最新推荐文章于 2021-12-10 11:04:29 发布

Fly_To_Sky666

最新推荐文章于 2021-12-10 11:04:29 发布

阅读量972

点赞数

分类专栏：物体位姿估计文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40378982/article/details/115308843

版权

物体位姿估计专栏收录该内容

9 篇文章 4 订阅

订阅专栏

CDPN

1 网络结构
2 Dynamic Zoom In (DZI)
3 Scale-invariant Translation Estimation (SITE)

Pipeline

1 网络结构

本文的思路是将物体的6DoF位姿估计拆分为旋转矩阵的估计和位移向量的估计。其中，旋转矩阵的估计首先通过网络学习2D-3D的稠密对应，然后通过RANSAC PnP算法可以鲁棒性地求解旋转矩阵；而位移向量的估计主要是估计物体中心点在图像上对应的投影点和深度。
本文创新的地方在于估计旋转矩阵时，提出了DZI模块，该模块可以摆脱网络对目标检测结果的依赖；同时在估计位移向量时，提出了SITE模块来回归 $(u, v)$ 坐标。

2 Dynamic Zoom In (DZI)

首先，DZI模块是用来在gT BBox的基础上随机采样得到新的BBox，它只作用于训练阶段。注意，文中用到的几个数据集的训练集都提供了真实的BBox标注，在此基础上随机采样得到BBox的主要目的是为了摆脱后续位姿估计网络对于目标检测网络的依赖性。在检测时，输入一张多实例多对象RGB图像，首先需要通过目标检测网络提取ROI区域，所以，DZI只作用于训练阶段。
那么在训练阶段，已知图像中某一个对象BBox的标签为 $(x, y, h, w)$ ，通过DZI模块随机采样得到的新的BBox的标签为:
DZI

3 Scale-invariant Translation Estimation (SITE)

SITE模块的作用是回归得到物体中心点对应的图像投影点的二维坐标以及深度。这里的创新之处在于借鉴了目标检测中回归BBox的思想，回归的量是一个相对偏移量。
SITE

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CDPN

CDPN1 网络结构2 Dynamic Zoom In (DZI)3 Scale-invariant Translation Estimation (SITE)1 网络结构本文的思路是将物体的6DoF位姿估计拆分为旋转矩阵的估计和位移向量的估计。其中，旋转矩阵的估计首先通过网络学习2D-3D的稠密对应，然后通过RANSAC PnP算法可以鲁棒性地求解旋转矩阵；而位移向量的估计主要是估计物体中心点在图像上对应的投影点和深度。本文创新的地方在于估计旋转矩阵时，提出了DZI模块，该模块可以摆脱网络
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。