SLAM之PTAM学习笔记

晨光ABC

已于 2022-09-20 12:13:00 修改

阅读量2.3w

点赞数 24

分类专栏： SLAM 文章标签： SLAM PTAM

于 2018-02-12 16:05:20 首次发布

本文链接：https://blog.csdn.net/u011178262/article/details/79315782

版权

SLAM 专栏收录该内容

16 篇文章 21 订阅

订阅专栏

概述

欢迎访问 持续更新：https://cgabc.xyz/posts/656ba423/

PTAM，全称Parallel Tracking And Mapping，是最早提出将Track和Map分开作为两个线程的一种SLAM算法，是一种基于关键帧的单目视觉SLAM算法。PTAM主要分为这几部分：

Track线程

FAST特征提取
地图初始化
跟踪定位
选取添加关键帧到缓存队列
重定位

Map线程

局部BundleAdjustment
全局BundleAdjustment
从缓存队列取出关键帧到地图
极线搜索加点到地图

另一方面，按照一般的视觉SLAM框架，PTAM也可分为

传感器数据获取（摄像头输入图像数据）
前端视觉里程计（跟踪定位、重定位）
后端优化（Bundle Adjustment）
建图（极线搜索加点）
没有回环检测

代码：cggos/ptam_cg，对原始PTAM代码进行了部分改动（将原来的makefile工程改成了cmake工程，改变了部分代码结构，添加带有公式的Doxygen文档注释，某些本文档提及的算法公式可能会出现代码注释中），核心算法没变。

FAST特征提取

为了SLAM的实时性，选择FAST作为特征提取的方法；
对于从数据流中输入的每一帧图像先进行金字塔分层(4层均值金字塔)，每一层都要进行FAST特征提取；

地图初始化

对于每帧图像提取的FAST特征点，因经常出现“扎堆”现象，再进行非极大值抑制，选出较好的特征点，然后对每个特征点计算Shi-Tomas得分，选出得分较高的特征点（不超过1000个，设置数量阈值），作为特征匹配的候选特征点。

先选择一帧图像，再通过基于SSD的块匹配选出第二帧图像，作为两帧关键帧；根据两帧图像间的匹配特征点，计算出两帧间的单应性矩阵，然后分解出对应的旋转平移矩阵，作为相机的初始位姿。

因单目的尺度不确定问题，根据经验设定一个尺度，作用于初始两帧间的旋转平移矩阵，并作为全局的尺度。

根据初始两帧间的旋转平移矩阵和特征点像素坐标，利用线性三角法深度估计算法估算出第一帧坐标系下的世界点三维坐标，再通过BundleAdjustment方法对世界点和相机初始位姿进行优化；因先前计算出的世界点数量可能不够，再通过极线搜索添加世界点，再通过BundleAdjustment方法对世界点和相机初始位姿进行优化。

根据现在的世界点，通过RANSAC找出主平面，作为系统的世界坐标系，同时计算出质心 $C$ ；计算出内点和主平面质心的协方差矩阵，通过PCA主成分分析得出主平面的法向量 $N$ ，然后通过Gram-Schmidt正交化计算出第一帧坐标系和主平面坐标系旋转矩阵 $R$ ，再根据质心 $C$ 和公式 $P_w=R(P_c-C)=RP_c-RC$ 计算出平移向量 $t = - RC$ 。

根据主平面计算出的旋转平移矩阵，将第一帧坐标系下的世界点和两帧的旋转平移矩阵变换到主平面对应的世界坐标系下，第二帧对应的旋转平移矩阵作为当前相机的位姿。

跟踪定位

（1）根据上一帧的相机位姿（旋转平移矩阵），通过作用运动模型和基于ESM的视觉跟踪算法对当前帧的相机位姿进行预测。

（2）根据预测的相机位姿，将当前所有世界点根据小孔成像原理进行投影，投影后的像素点记为 $p_i$ ，并计算出对应的金字塔层级。

（3）根据金字塔高层优先原则，选取一定数量世界点（通常，粗搜索选取30～60个，细搜索选取1000个左右）。

（4）遍历选取的世界点，对于每一个世界点对应源帧图像中已经进行Warp变换的8x8的模板块，和以当前帧图像点 $p_i$ 一定范围内的每一个FAST特征点为中心选取的8x8像素块，进行基于SSD的相似度计算，选择具有最小SSD值的FAST特征点，并记录查找到的特征点数量，用于后期跟踪质量评估；出于精确考虑，可通过反向合成图像对齐算法求取该特征点的亚像素坐标，记为 $p_i'$ ，这样选取的每个世界点都对应 $p_i$ 和 $p_i'$ ，重投影误差即为 $p_i' - p_i$ 。