ORB SLAM中几个重要概念，翻译自ORBSLAM作者主论文

最新推荐文章于 2023-11-29 22:15:54 发布

fang_liu_yang

最新推荐文章于 2023-11-29 22:15:54 发布

阅读量4.2k

点赞数 2

分类专栏： SLAM 文章标签： ORBSLAM

本文链接：https://blog.csdn.net/fang_liu_yang/article/details/53488765

版权

SLAM 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

翻译自论文：
http://wenku.baidu.com/link?url=ZygOb-moGgnQiWdKNE8Pwo55OpV8zWRpA2us1_FfJ5J_-rFvScqucAMDShroawjWNb2eQKLMX8665qY8TwNID2v8byPfYCPTgXW3leNrtnu

在ORB SLAM的主论文中的第三部分，有几个名词的介绍，网络上的翻译我感觉不合我的理解，于是对照原文重新翻译如下：

C. Map points, KeyFrames and their Selection.

Map point pi 保存下列信息：
1，它的3D世界坐标系位置
2，视图方向Ni, 这是它的所有视图方向的平均单位向量（视图方向为那些连接观测到这个点的关键帧的光心和这个点的射线）。
3，一个代表ORB 描述符 Di, 它是在这个Map point 被观测到的那些关键帧里面的所有相关联描述符里，加权平均距离最小的一个关联描述符。
4，根据ORB特征的尺度不变限制条件，这个点能够被观测到的最大距离 dmax 和最小距离 dmin.

关键帧Ki (Key Frame) 存贮下列信息：
1，相机的位姿 Tiw，这是一个刚体转换，用于转换世界坐标系中的点到相机坐标系。
2，相机的内参，包括焦距(focal length) 和主点 (principal point)
3，帧中提取的ORB特征，与一个地图点关联或者不关联，如果畸变模型提供的话，这个地图点的坐标是经过矫正没有畸变的。

地图点（Map point) 和关键帧的创建策略比较宽松，但之后有一个非常严苛的挑选机制来处理冗余的关键帧的检测以及错误匹配的或者没有跟踪到的地图点的检测。这样的话就允许在探索的时候灵活地扩展地图，有助于在旋转或者快速移动这样的恶劣条件下增强鲁棒性，同时在连续的重复访问相同环境时，例如终身运行的情况下，仍然能够控制地图的存储尺寸不会太大。另外，与PTAM相比，我们的地图包含了更少的无用数据，代价是包含了更少的点。

D: Covisibility Graph and Essential Graph

关键帧之间的Covisibility 信息在我们的系统中几个不同的任务之间是很有用的，它被表示成无向有权图的形式（参考论文7）。每个节点都是一个关键帧，两个关键帧之间如果存在一些共享的观测到的map points （至少15个）的话，那么就存在一条边，边的权重 Ө 就是这个共同的map points的数量，能够反映出关键帧之间视图的相似程度。
为了做回环矫正我们做一个位姿图优化（参考论文6），来把闭环误差分散到图中。如果包含Covisiblity graph 中的所有边的话就太稠密了，所以我们建立一个Essential Graph，这个Essential Graph 保留了所有的节点（就是关键帧），但是有更少的边，这仍然能够保持一个强网络以产生精确的结果。系统从初始关键帧开始，增量地建立一个生成树，这个生成树提供了一个有着最小数量的边的Covisibility Graph 的子图。当一个新的关键帧被插入时，这个关键帧被加入数中，并被链接到和这个新关键帧有最多共同观测点的一个关键帧上；当一个关键帧被筛选策略剔除时，系统更新与这个关键帧有关的所有链接。 Essential Graph 包含了这个生成树，来自Covisibility graph 的具有比较高的covisibility 的边的子集 (Өmin = 100)，以及闭环边，从而形成一个相机间的强网络。图2 展示了一个covisibility graph，生成树以及相关联的essential graph的例子。如VIII-E 节的实验所示，当执行位姿图优化的时候，结果是如此地精确以致于额外的完全集束调整优化(full bundle adjustment optimization) 几乎对结果没有改进。Essential Graph的效率和Өmin的影响见于第VIII-E 节的结束部分。

E: Bags of Words Place Recognition 词袋位置识别

系统包含有一个基于DBoW2 (参考论文5）的词袋位置识别模块，用于回环检测和重定位。如果把描述符空间称为视觉词典，那么视觉单词就是描述符空间的离散化而已。视觉词典是离线由ORB描述符创造出来的，这些描述符抽取自一个很大的图像集合。如果这些用于抽取词典的图像集合足够一般化，那么相同的词典可以被用于不同的环境设定并仍能取得不错的表现，如我们之前的工作（参考论文11）所示。系统增量式构造了一个数据库，数据库针对视觉词典中的每一个视觉单词，都存储了关于这个视觉单词在哪些关键帧中被看到的一个逆序索引，所以查询这个数据库是很快的。当一个关键帧被筛选过程删掉时, 数据库也会被更新。
因为在关键帧间可能存在视觉重复的部分，当检索数据库时将找到不止一个有高分数的关键帧。原始的DBoW2 考虑了这种视觉重复，把时间上相近图像的分数加在一起。这样做有一个局限，就是没有包括那些在一个不同时间点被插入进来但是对应相同地点的那些关键帧。取而代之，我们的做法是把那些在一个covisibility graph 中相连接的那些关键帧分组。另外，我们的数据库返回所有那些分数超过最好分数75%的关键帧。

用词袋表示特征匹配的一个额外的好处可以参考论文5, 当我们想要计算两个ORB特征集合的对应性时，我们可以约束只匹配那些属于词典树中一个特定层次的相同节点的特征（我们选择6层中的第二层），以便加快搜索过程。在处理三角化新的云点时的搜索匹配时，以及回环检测及重定位时，我们也使用了相同的技巧。我们也通过朝向一致性测试改进了对应关系，去掉了异常数据，保证了所有对应关系的旋转一致性，详细情况可参考论文11。

fang_liu_yang

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ORB SLAM中几个重要概念，翻译自ORBSLAM作者主论文

ORBSLAM Map points, KeyFrames and their Selection， Covisibility Graph and Essential Graph， Bags of Words Place Recognition
复制链接

扫一扫