DH3D Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization

最新推荐文章于 2022-02-12 10:34:27 发布

知识混子_

最新推荐文章于 2022-02-12 10:34:27 发布

阅读量1k

点赞数 1

分类专栏：视觉定位文章标签： slam

本文链接：https://blog.csdn.net/weixin_44125273/article/details/109331649

版权

视觉定位专栏收录该内容

6 篇文章 1 订阅

订阅专栏

DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization

Abstract

设计了一种可以从原始点云中提取3维局部特征和描述符的网络。集成了FlexConv和Squeeze-and-Excitation (SE) 使得学习到的局部描述符获取多层次的几何信息和通道关系。通过有效的注意力机制直接聚合局部描述符来生成全局描述符；通过这种方法，局部和全局的描述符可以在一个forward中生成.

Introduction

常用方法：global place recognition+local 6DOF pose refinement；2D图像与3D模型匹配，有了深度网络后精度和鲁棒性有了提升。

本文：提出用语大规模点云重定位的分层深度网络。估计局部特征分辨力的置信图并用无监督学习选择适合匹配的特征点；局部聚合形成全局特征。

贡献：1.首次提出基于点云的全局位置识别和6DOF位姿估计相结合的方法；在一个前向的过程中就可以提取局部特征和全局特征，比以前的方法速度快；

2.使用Flex Convolution（FlexConv）和Squeeze-and-Excitation（SE）块分别将多级空间上下文信息和基于通道的特征相关性融合到局部描述符中，使得特征匹配的性能变好，也提高了全局特征的性能；

3.提出一种无监督显式学习3D特征点检测器方式

4.在点云检索达到SOTA

5.在Lidar上训练，但是在视觉SLAM生成的点云上效果也很好

Related Work

手工制作的局部描述符

学习的局部描述符

3D特征点检测器

手工制作的全局描述符

学习的全局描述符

Hierarchical 3D Descriptors Learning

3D Local Feature Encoder and Detector

已有：（1）detect-then-describe ，其检测器是直接从输入点学习的注意力图。在推理期间，仅针对注意力图定义的关键点提取描述符，通常只利用输入数据的low-level structures，不能利用描述符编码中的高级信息。（2）特征描述是基于PointNet的，其对称函数倾向于仅提供局部集群的有限结构信息。

本文：describe-and-detect，用来推迟我们的检测阶段，以便在学习的描述符中使用更高级别的信息。使用Flex Convolution（FlexConv）和Squeeze-and-Excitation（SE）块分别将多级空间上下文信息和基于通道的特征相关性融合到局部描述符中。

FlexConv(利用空间上下文信息)：考虑3d周围k个点 $N_k(p_l) =\{p_{l_1},· · · ,p_{l_k}\}$ ，将k+1个点当做图来处理，顶点，边。图上的运算就可以用 $f_Θ(p_l,p_{l_k})$ 表示，PointNet和可以看作是 $f_Θ(p_l,p_{l_k})=f_Θ(p_l)$ 没有关注周围像素点，FlexConv是传统卷积推广，定义如下：

$h(p_{l_i})\in R^C$ 将一个点投影到高位特征空间的编码函数；卷积核 $\omega:R^3\times R^3->R^C$ .

SE block（将Flex输出的不同通道进行关联）:输入 $U=\{u_1,……,u_c\}\in R^{N\times C}$ ， $u_c\in R^N$ 表FlexConv第c个通道的输出。

（1） $z=f_{sq}(U):R^{N\times C}->R^C$ :压缩通道，全局平均池化，聚合空间信息；

（2） $s=f_{ex}(z):R^C->R^C$ :FC+ReLU+FC，捕获通道依赖关系和通道间的非线性关系

（3）SE Block学到的通道激活（感觉类似于权重）用于重新校准FlexConv的输出。

Encoder architecture：输入：点云 $P=\{p_1,...,p_N\}\in R^{N\times 3}$ ,从两个空间分辨率中提取结构信息（两个分支）。将两种分辨率的输出相加，融合多层次的上下文信息，生成局部特征图 $\Psi$ 。L2归一化后得到局部描述符 $L_{des}$ 。 $P_i\in P\ 且\ P_j\in P'时\ M(i,j)=1$ 。损失函数定义如下，