总结(/Review): 回环检测中的位置识别(Place Recognition)

更新于2018.8

开始之前

回环检测的关键在于重新识别到同一个地方,这块领域被称为位置识别(Place Recognition)。
此文主要总结大视角变化和场景变化中的位置识别

位置识别中的一些概念

位置识别模块分为三个部分:图像处理部分;已知地图表达部分;置信决策部分(判断该图像是否属于该地图/环境)

scene recognition:识别场景的类别(很大程度上,本质是一个分类问题);同一场景可能来自于不同的地方?

图像识别(image recognition)又称为:Content-based image retrieval (CBIR)

place recognition:位置表示一块区域,比如厨房;识别是否是以前来过的地方(本质是一个图像检索问题)

object recognition: 目标表示一个有明显边界的饿哦东西,比如桌子,显示屏

topological informaion: the node and the relation of each node.只关心两个节点是否连通,而不关心这两个点的位置关系

metric information: distance, direction, or both on the map edge(node edge).关心节点的物理位置,节点之间的相对物理位置关系

主要困难和主要思路

回环识别面对的主要困难:
- viewpoint change (little overlap)
- condition change (appearance different)
- high-efficiency

目前为侧重应对大视角变化和场景变化的方法分为3类方法:
- 使用更好的学习型特征;
- 使用high level + local level(学习型特征+传统特征;语义型+中间网络层输出);
- 加入三维信息,得到估计视角下的合成/渲染图

图像处理部分

位置描述分为两类:
- 选择性地挑选部分图像内容进行表达(BoW);
- 将整幅图片作为一个向量进行处理(HOG,Gist)

others libraries: FAB-MAP(SIFT, SURF, more than 10000), SqeSLAM

其中:
鲁邦的特征有:U-SURF,基于边的特征,CNN

局部特征方法:
- 词袋方法
- fisher vector
- VLAD(Vectors of locally aggregated descriptor(less computable)

全局特征方法:
- GIST(2006)
- CNN: VGG-16 [18], Net-VLAD [1] and PoseNet,NetVLAD

词袋方法(比如BoW,FAB-MAP)不太受视角变化影响(pose invariant)

全局特征(语义特征或整张图特征)比局部特征更加容易受视角(也就是观测者/相机的位姿)

  • 8
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值