Realtime edge-based visual odometry for a monocular camera
文中对edge类型的匹配方式是在垂直方向通过最小化投影信息的量来求解对应帧之间的位姿变换信息。
Abstract
文中通过结合特征法和直接法俩种主流视觉SLAM来实现更加精准的SLAM方案,首先,通过特征法获取直线信息,之后剩余的部分通过直接法对直线信息所携带的结构信息进行分析求解。
Introduction
单目和半稠密SLAM的优缺点,以及文中期望实现的目标。
Related Work
Dense and Semi-Dense Visual Odometry
Feature Edge Based VO
基于边界的视觉SLALM方案所存在的难题有
- 难以匹配;
- 需要大量的计算;
- 只在一个方向进行校准,即对边界的垂直方向进行校准。
Edge Detection
Method Outline
- 对图像信息进行边界提取;
- 对特征信息进行跟踪,通过对代价函数的误差值最小化,求解相邻帧之间的位姿变换信息;
- 建图。
Method Description
Edge Extraction
线性特征的提取对于整个系统的实现效果影响很大,本文中的线性特征的提取方案采用DoG的方案,通过对不同高斯参数图层做差获取差分高斯图层,通过对像素的梯度信息进行阈值踢除可以大大的减轻工作量,通过3*3的小平面求解特征信息,即求解距离平面中心位置中的0差值坐标信息来求解特征信息,通过对8个邻居像素的链接检测获取连贯的特征信息。获得的输出是一系列特征边上的像素点信息,称之为keylines,以下是对他们的参数描述:
- q ^ \hat q q^表示亚像素位置信息;
- m ^ \hat m m^表示的线性特征的局部切线;
- ρ \rho ρ表示像素位置的逆深度信息;
- σ ρ \sigma_{\rho} σρ表是逆深度不确定性;
- n i d , p i d n_{id},p_{id} nid,pid分别表示相邻像素索引。
Tracking
这一部分主要的目的是通过将构建的代价函数最小化求解得到俩帧之间的位姿变换信息。本文中采用的代价函数是在edge垂直方向上对应点的投影信息长度,对应的示意图和代价函数如下图所示:
d
m
=
(
q
ˉ
t
−
q
ˉ
n
)
⋅
m
ˉ
n
E
=
∑
i
w
i
σ
ρ
i
2
[
M
(
(
τ
(
q
ˉ
o
i
,
ρ
o
i
,
x
ˉ
)
−
q
ˉ
n
i
)
⋅
m
ˉ
n
i
)
]
2
x
ˉ
=
a
r
g
m
i
n
x
E
d_m=(\bar q_t-\bar q_n)\cdot\bar m_n\\E=\sum_i\frac{w_i}{\sigma^2_{\rho_i}}[M((\tau(\bar q_{o_i},\rho_{o_i},\bar x)-\bar q_{n_i})\cdot \bar m_{n_i})]^2\\\bar x=arg min_x E
dm=(qˉt−qˉn)⋅mˉnE=i∑σρi2wi[M((τ(qˉoi,ρoi,xˉ)−qˉni)⋅mˉni)]2xˉ=argminxE
通过将上述的代价函数最小化求解得相邻帧之间的位姿变换信息。
Energy Minimizattion
通过在上一帧的位姿信息和0之间对当前帧位姿信息的初始值进行配置使得当前帧的位姿信息在迭代优化的过程中能够更快、精度更高的获取最优值。同时加入权重核函数来抑制迭代收敛的计算过程。
Implementation details
通过构建辅助图像提升运算速度和效率。
Mapping
本文中只建立上一幅图的地图信息。
matching
通过对参考帧和当前帧中的相应匹配特征信息的误差进行阈值分析踢除不合理的匹配信息。
Regularization
Depth estimation
Inertial Aided Formulation
该部分对陀螺仪使用的必要性进行了介绍,相比于单纯的视觉里程计而言,陀螺仪所突出的优点以及对应的整个计算过程。
Results
Conclusion
文中提出了一种结合特征信息和半稠密法相结合的视觉里程计的方案,能够保证在嵌入式平台上运行的实时性。