SLAM回环检测中的（Bag-of-Words）词袋模型

最新推荐文章于 2023-01-11 07:00:12 发布

StrawberryBoy

最新推荐文章于 2023-01-11 07:00:12 发布

阅读量3.4k

点赞数 1

分类专栏： SLAM 文章标签： SLAM 词袋

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lhw19931201/article/details/86555189

版权

SLAM 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

• 视觉里程计仅用相邻帧图像估计运动，存在累积误差

• 回环检测通过发现到达过的地方，可以有效修正运动轨迹，

消除累积误差

• 从而保证了轨迹与地图的全局一致性（Globally Consistent）

我们可以看到上图绿色回路没有闭合，经过回环检测后的红色轨迹已经闭合。

•词袋模型如何实现？

•将Bag-of-words模型应用于图像表示。为了表示一幅图像，我们可以将图像看作文档，即若干个“视觉词汇”的集合。

•利用FAST算法，从每类图像中提取视觉词汇，将所有的视觉词汇集合在一起；

•利用K-Means算法构造单词表，合并词义相近的视觉词汇，构造一个包含K个词汇的单词表；

•统计单词表中每个单词在图像中出现的次数，从而将图像表示成为一个K维数值向量。

举一个简单的例子：

其实词袋模型最初用作文本分类，现在我们将词袋用作图像表示，将一幅图像看作是一个文档，即若干个“视觉词汇”组成的集合。

利用FAST算法，从每类图像中提取视觉词汇，将所有视觉词汇集合在一起，如下图：

从图像中提取相互独立的视觉词汇

利用k-means算法进行聚类，合并词义相近的视觉词汇，构造包含k个词汇的单词表；使每一簇内具有较高的相似度。如下图：

•统计单词表中每个单词在图像中出现的次数，从而构成一个直方图。针对人脸、自行车、吉他三个文档，抽取相似的部分合并为一类，构造一个词典，即Directory={1:“自行车“，2.“人脸”，3.“吉他”，4.“人脸类”}

在论文Galvez-López D, Tardos J D. Bags of Binary Words for Fast Place Recognition in Image Sequences[J]. IEEE Transactions on Robotics, 2012, 28(5):1188-1197.中，词袋模型是这样建立的：

字典建立步骤：

1.从一些训练图像中离线提取丰富的特征集;

2.将提取的特征用 k-means++种子进行k-中值聚类，将描述子空间划分成 k 类;

3.将划分的每个子空间，继续利用 k-means++ 算法做聚类 ;

4.按照上述循环，将描述子建立树形结构.

整个算法流程图：

下图为词袋树：

其中词袋树中还包括了正向索引（Direct index ）和反向索引（Inverse index）：

•Direct index :正向索引存储图像特征，以及词汇树某一层上相关联节点的特征。

在回环检测的最后阶段——几何结构验证阶段，可以加速匹配候选图像与当前图像之间的特征点对

•Inverse index: 反向索引存储了图像中单词出现的权重。可以加快待比较的图像搜索速度。

当向数据库添加新图像时，将更新反向索引以及当数据库搜索某些图像时，将访问反向索引。

•计算两个词袋向量v1和v2之间的相似性：

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。