更新于2018.8
开始之前
回环检测的关键在于重新识别到同一个地方,这块领域被称为位置识别(Place Recognition)。
此文主要总结大视角变化和场景变化中的位置识别。
位置识别中的一些概念
位置识别模块分为三个部分:图像处理部分;已知地图表达部分;置信决策部分(判断该图像是否属于该地图/环境)
scene recognition:识别场景的类别(很大程度上,本质是一个分类问题);同一场景可能来自于不同的地方?
图像识别(image recognition)又称为:Content-based image retrieval (CBIR)
place recognition:位置表示一块区域,比如厨房;识别是否是以前来过的地方(本质是一个图像检索问题)
object recognition: 目标表示一个有明显边界的饿哦东西,比如桌子,显示屏
topological informaion: the node and the relation of each node.只关心两个节点是否连通,而不关心这两个点的位置关系
metric information: distance, direction, or both on the map edge(node edge).关心节点的物理位置,节点之间的相对物理位置关系
主要困难和主要思路
回环识别面对的主要困难:
- viewpoint change (little overlap)
- condition change (appearance different)
- high-efficiency
目前为侧重应对大视角变化和场景变化的方法分为3类方法:
- 使用更好的学习型特征;
- 使用high level + local level(学习型特征+传统特征;语义型+中间网络层输出);
- 加入三维信息,得到估计视角下的合成/渲染图
图像处理部分
位置描述分为两类:
- 选择性地挑选部分图像内容进行表达(BoW);
- 将整幅图片作为一个向量进行处理(HOG,Gist)
others libraries: FAB-MAP(SIFT, SURF, more than 10000), SqeSLAM
其中:
鲁邦的特征有:U-SURF,基于边的特征,CNN
局部特征方法:
- 词袋方法
- fisher vector
- VLAD(Vectors of locally aggregated descriptor(less computable)
全局特征方法:
- GIST(2006)
- CNN: VGG-16 [18], Net-VLAD [1] and PoseNet,NetVLAD
词袋方法(比如BoW,FAB-MAP)不太受视角变化影响(pose invariant)
全局特征(语义特征或整张图特征)比局部特征更加容易受视角(也就是观测者/相机的位姿)