随读笔记
传统SLAM算法分为:帧间估计与后端优化两部分。
深度学习与帧间估计
无需特征提取、特征匹配和复杂的集合运算。
1.Konda 和 Memisevic提出基于端到端的深度神经网络
(1)提取图像序列深度和运动信息
利用乘性交互神经网络进行时序立体图像的同步检测,将立体图像序列之间的空间变换估计转换为同步检测,称为无监督同步/深度自动编码器(SAD-E)。
(2)图像序列速度与方向改变估计
将上一层SAD-E提取的运动和深度信息作为卷积神经网络层(CNN)输入,用以学习图像速度和方向改变。
2.Costante 利用卷积神经网络学习图像数据的最优特征表示进行视觉里程计估计
(1)先用 Brox 算法提取连续 2 帧的稠密光流特征,以此作为 CNN 网络的输入。
(2)将全局特征 CNN-1b 和局部特征 CNN-4b 结合构建了 P-CNN。
优点:在应对图像运动模糊、光照变化方面的鲁棒性;
缺点:实验结果也说明了所提算法对训练数据的依赖,特别是当图像序列帧间速度过快时,算法误差较大,其原因是训练集缺乏高速训练样本造成估计的旋转误差较大。
3.Handa利用神经网络构建了包含全局变换、像素变换和 M 估计器在内的 gvnn(geometric vision with neural network/基于神经网络的几何视觉)软件库
基于深度学习的闭环检测
1.Chen 等首次提出了基于 CNN 模型的位置识别技术
(1)作者选择 ImageNet 大赛中用以物体识别的 OverFeat 神经网络模型进行图像描述。
(2)利用各层特征构造混合矩阵。
(3)构造空间连续性滤波器和时间连续性滤波器进行综合验证,提高匹配准确率。