《视觉SLAM十四讲》-- 视觉里程计2

最新推荐文章于 2024-07-12 18:56:03 发布

算法导航

最新推荐文章于 2024-07-12 18:56:03 发布

阅读量62

点赞数

文章标签：算法

本文链接：https://blog.csdn.net/qq_44175983/article/details/134378022

版权

文章目录

- 07 视觉里程计 2

07 视觉里程计 2

7.1 直接法的引出

特征点的缺点：

关键点的提取与描述子的计算非常耗时，实时性差；
使用特征点时，忽略了特征点以外的所有信息，而丢弃了部分可能有用的信息；
有时会出现特征缺失的情况，如白墙或者空荡荡的走廊等。

为了克服上述问题，提出了 光流法 和 直接法。

光流法：只计算关键点，不计算描述子，采用光流跟踪。

直接法：由光流法演变而来。根据像素灰度信息同时估计相机运动和点的投影，不要求必须为角点，甚至可以是随机点。

7.2 2D 光流

光流描述了像素随时间在图像之间运动的过程。其中，计算部分像素的运动称为 稀疏光流，计算所有像素的运动称为 稠密光流。下面主要介绍以 LK 光流为代表的稀疏光流。
在这里插入图片描述

7.2.1 Lucas-Kanade 光流

（1）我们认为图像是随时间变化的，也就是说图像可以看做时间的函数，那么，一个在 $t$ 时刻，位于 $(x, y)$ 处的像素，它的灰度可以写成

$\boldsymbol{I}(x,y,t)$

首先，引入光流法的基本假设：

灰度不变假设：同一个空间点的像素灰度值，在各个图像中是固定不变的。

（2）对于 $t$ 时刻位于 $(x, y)$ 处的像素，在 $t+\mathrm{d}t$ 时刻运动到 $(x+\mathrm{d}x,y+\mathrm{d}y)$ 处，根据灰度不变假设

$\boldsymbol{I}(x+\mathrm{d}x,y+\mathrm{d}y,t+\mathrm{d}t)=\boldsymbol{I}(x,y,t) \tag{7-1}$

对左边进行泰勒展开，并保留一阶项：

$\boldsymbol{I}(x+\mathrm{d}t,y+\mathrm{d}y,t+\mathrm{d}t)\approx\boldsymbol{I}(x,y,t)+\frac{\partial \boldsymbol{I}}{\partial x}\mathrm{d}x+\frac{\partial \boldsymbol{I}}{\partial y}\mathrm{d}y+\frac{\partial \boldsymbol{I}}{\partial t}\mathrm{d}t \tag{7-2}$

由灰度不变，所以

$\frac{\partial \boldsymbol{I}}{\partial x}\mathrm{d}x+\frac{\partial \boldsymbol{I}}{\partial y}\mathrm{d}y+\frac{\partial \boldsymbol{I}}{\partial t}\mathrm{d}t=0 \tag{7-3}$

两边同除 $\mathrm{d}t$ ，得

$\frac{\partial \boldsymbol{I}}{\partial x}\frac{\mathrm{d}x}{\mathrm{d}t}+\frac{\partial \boldsymbol{I}}{\partial y}\frac{\mathrm{d}y}{\mathrm{d}t}=-\frac{\partial \boldsymbol{I}}{\partial t} \tag{7-3}$

其中， ${\mathrm{d}x}/{\mathrm{d}t}$ 、 ${\mathrm{d}y}/{\mathrm{d}t}$ 分别为像素在 $x$ 、 $y$ 轴上运动的速度，记为 $u$ 、 $v$ ； ${\partial \boldsymbol{I}}/{\partial x}$ 、 ${\partial \boldsymbol{I}}/{\partial y}$ 分别为图像在 $x$ 、 $y$ 方向上的梯度，记为 $\boldsymbol{I}_x$ 、 $\boldsymbol{I}_y$ ；把像素灰度对时间的变化量记为 $\boldsymbol{I}_t$ 。那么上式写成矩阵形式

$\left[\begin{array}{ll} \boldsymbol{I}_{x} & \boldsymbol{I}_{y} \end{array}\right]\left[\begin{array}{l} u \\ v \end{array}\right]=-\boldsymbol{I}_{t} \tag{7-4}$

我们希望求出 $u$ 和 $v$ ，但上式是一个二元一次方程，条件不足，因此还需引入额外的约束。假设在一个大小为 $\times w$ 的图像窗口中，这 $w^2$ 个像素都具有相同的运动，那么就可以得到 $w^2$ 个方程：

$\left[\begin{array}{ll} \boldsymbol{I}_{x} & \boldsymbol{I}_{y} \end{array}\right]_k\left[\begin{array}{l} u \\ v \end{array}\right]=-\boldsymbol{I}_{tk}，\quad k=1,2,...,w^2 \tag{7-5}$

令

$\boldsymbol{A}=\left[\begin{array}{c} {\left[\boldsymbol{I}_{x}, \boldsymbol{I}_{y}\right]_{1}} \\ \vdots \\ {\left[\boldsymbol{I}_{x}, \boldsymbol{I}_{y}\right]_{k}} \end{array}\right], \boldsymbol{b}=\left[\begin{array}{c} \boldsymbol{I}_{t 1} \\ \vdots \\ \boldsymbol{I}_{t k} \end{array}\right]$

则

$\boldsymbol{A}\left[\begin{array}{l} u \\ v \end{array}\right]=-b \tag{7-6}$

这又是一个超定方程，采用最小二乘解，即

$\left[\begin{array}{l} u \\ v \end{array}\right]^*=-(\boldsymbol{A}^{\mathrm{T}}\boldsymbol{A})^{-1}\boldsymbol{A}^{\mathrm{T}}\boldsymbol{b} \tag{7-7}$

7.2.1 实践：LK 光流

7.3 直接法

7.3.1 推导过程

如图，已知空间点 $P$ 的世界坐标为 $[X,Y,Z]^\mathrm{T}$ ，在两帧图像上的像素坐标分别为 $\boldsymbol{p}_1$ 、 $\boldsymbol{p}_2$ （未知）。
在这里插入图片描述

我们希望求出第一个相机到第二个相机的相对位姿变换，以第一个相机为初始参照系，经旋转和平移 $\boldsymbol{R}$ 、 $\boldsymbol{t}$ 到第二个相机，有

$\boldsymbol{p}_1=\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]_1=\frac{1}{Z_1}\boldsymbol{KP}$
$\boldsymbol{p}_2=\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]_2=\frac{1}{Z_2}\boldsymbol{K}(\boldsymbol{RP+t})=\frac{1}{Z_2}\boldsymbol{K}(\boldsymbol{TP})_{1:3} \tag{7-8}$

直接法中，由于没有特征点匹配，我们无法知道哪一个 $\boldsymbol{p}_1$ 和 $\boldsymbol{p}_2$ 对应着同一个点。于是，可以通过优化相机位姿，来寻找与 $\boldsymbol{p}_1$ 更相似的 $\boldsymbol{p}_2$ 。这里优化的是 光度误差 ，也就是两个像素的亮度误差：

$e=\boldsymbol{I}_1(\boldsymbol{p}_1)-\boldsymbol{I}_2(\boldsymbol{p}_2) \tag{7-9}$

注意，这里的 $e$ 是标量。目标优化函数为

$\min_{\boldsymbol{T}}J(\boldsymbol{T})=\|e\|^2 \tag{7-10}$

假设一个空间点在各个视角下成像的灰度是不变的，我们有许多个空间点 $P_i$ ，那么，整个相机位姿估计问题变为

$\min _{\boldsymbol{T}} J(\boldsymbol{T})=\sum_{i=1}^{N} e_{i}^{\mathrm{T}} e_{i}, \quad e_{i}=\boldsymbol{I}_{1}\left(\boldsymbol{p}_{1, i}\right)-\boldsymbol{I}_{2}\left(\boldsymbol{p}_{2, i}\right) \tag{7-11}$

定义

$\boldsymbol{q=TP}$
$\boldsymbol{u}=\frac{1}{Z}\boldsymbol{Kq}$

那么，误差 $e$ 关于位姿 $\boldsymbol{T}$ 的导数为

$\frac{\partial e}{\partial \boldsymbol{T}}=\frac{\partial \boldsymbol{I}_2}{\partial \boldsymbol{u}}\frac{\partial \boldsymbol{u}}{\partial \boldsymbol{q}}\frac{\partial \boldsymbol{q}}{\partial \delta\boldsymbol{\xi}}\delta\boldsymbol{\xi} \tag{7-12}$

其中， $\delta\boldsymbol{\xi}$ 为 $\boldsymbol{T}$ 的左扰动。分别看每一项：

（1）第一项 ${\partial \boldsymbol{I}_2}/{\partial \boldsymbol{u}}$ 为 $\boldsymbol{u}$ 处的像素梯度；

（2）第二项 ${\partial \boldsymbol{u}}/{\partial \boldsymbol{q}}$ ，也就是像素坐标关于相机坐标的导数，记 $\boldsymbol{q}=[X,Y,Z]^\mathrm{T}$ ，则有

$\frac{\partial \boldsymbol{u}}{\partial \boldsymbol{q}}=\left[\begin{array}{lll} \frac{\partial u}{\partial X} & \frac{\partial u}{\partial Y} & \frac{\partial u}{\partial Z} \\ \frac{\partial v}{\partial X} & \frac{\partial v}{\partial Y} & \frac{\partial v}{\partial Z} \end{array}\right]=\left[\begin{array}{ccc} \frac{f_{x}}{Z} & 0 & -\frac{f_{x} X}{Z^{2}} \\ 0 & \frac{f_{y}}{Z} & -\frac{f_{y} Y}{Z^{2}} \end{array}\right] \tag{7-13}$

（3）第三项 ${\partial \boldsymbol{q}}/{\partial \delta\boldsymbol{\xi}}$ 为变换后的三维点对李代数的导数，前面已经推导

$\frac{\partial \boldsymbol{q}}{\partial \delta \boldsymbol{\xi}}=\left[\boldsymbol{I},-\boldsymbol{q}^{\wedge}\right] \tag{7-14}$

将后两式合并（见式（6-43）），得

$\frac{\partial \boldsymbol{u}}{\partial \delta \boldsymbol{\xi}}=\left[\begin{array}{cccccc} \frac{f_{x}}{Z} & 0 & -\frac{f_{x} X}{Z^{2}} & -\frac{f_{x} X Y}{Z^{2}} & f_{x}+\frac{f_{x} X^{2}}{Z^{2}} & -\frac{f_{x} Y}{Z} \\ 0 & \frac{f_{y}}{Z} & -\frac{f_{y} Y}{Z^{2}} & -f_{y}-\frac{f_{y} Y^{2}}{Z^{2}} & \frac{f_{y} X Y}{Z^{2}} & \frac{f_{y} X}{Z} \end{array}\right] \tag{7-15}$

于是，推导出误差关于李代数的雅克比矩阵：

$\boldsymbol{J}=-\frac{\partial \boldsymbol{I}_2}{\partial \boldsymbol{u}}\frac{\partial \boldsymbol{u}}{\partial \delta \boldsymbol{\boldsymbol{\xi}}} \tag{7-16}$

采用迭代优化的方法求解出式（7-11）的最优解。

7.3.2 直接法的优缺点

（1）直接法优点

可以省去计算特征点、描述子的时间；
只需要像素梯度即可，不需要特征点；
可构件半稠密乃至稠密地图，这是特征点法做不到的。

（2）直接法缺点

非凸性；
单个像素没有区分度：选点少时效果较差，一般用 500 个点以上；
灰度不变假设是很强的假设，相机会自动调整曝光参数、或者光照变化，都会使得图像整体亮度发生变化。

算法导航

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《视觉SLAM十四讲》-- 视觉里程计2

根据像素灰度信息同时估计相机运动和点的投影，不要求必须为角点，甚至可以是随机点。灰度不变假设是很强的假设，相机会自动调整曝光参数、或者光照变化，都会使得图像整体亮度发生变化。（1）我们认为图像是随时间变化的，也就是说图像可以看做时间的函数，那么，一个在。，但上式是一个二元一次方程，条件不足，因此还需引入额外的约束。使用特征点时，忽略了特征点以外的所有信息，而丢弃了部分可能有用的信息；假设一个空间点在各个视角下成像的灰度是不变的，我们有许多个空间点。：同一个空间点的像素灰度值，在各个图像中是固定不变的。
复制链接

扫一扫