视觉SLAM十四讲_视觉里程计2

最新推荐文章于 2024-11-15 16:35:44 发布

OwnResponsibility

最新推荐文章于 2024-11-15 16:35:44 发布

阅读量152

点赞数

分类专栏： SLAM 文章标签：计算机视觉人工智能算法

本文链接：https://blog.csdn.net/qq_38757779/article/details/128753963

版权

SLAM 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

文章目录

前言
一、光流法
- 1.1、LK光流
二、直接法
- 2.1 公式推导
总结

前言

如有侵权,请告知删除

B站一位学姐的SLAM十四讲讲解的笔记.后续在此基础上继续完善.

问题引出:
$\fbox{特征点法}\begin{cases}\color{#0FB}理解图像特征点的意义,掌握在单幅图像中提取特征点及多幅图像中匹配特征点的方法\\\color{#0FB}理解对极几何的原理,利用对极几何的约束,恢复出图像之间的摄像机的三维运动\\\color{#0FB} 理解如何通过三角化,获得二维图像上对应的三维结构\\\color{#0FB} 理解PNP问题,及利用已知三维结构与图像的对应关系,求解摄像机的三维运动.\\\color{#0FB} 理解ICP问题.及利用点云的匹配关系,求解摄像机的三维运动. \end{cases} \\~ \\ \Downarrow \\~\\ \fbox{特征点法问题}\begin{cases} \color{#F00} 在图像中 {\bf{提取}}特征点并计算特征描述 & \color{#F00}非常耗时\\ \color{#F00}通过计算描述子距离在不同图像中寻找{\bf匹配} & \color{#F00}非常耗时\\ 利用通过匹配点信息计算相机位姿&正常 \end{cases}$

$\fbox{改进:}\begin{cases} 通过其他方式寻找匹配点(\cancel{描述子} )& \color{#00F}光流\\ 1.提取可能是随机点的特征点;2. 不去进行匹配,直接进行位姿估计 &\color{#00F}直接法 \end{cases}$

提示：以下是本篇文章正文内容，下面内容仅供参考

一、光流法

一种描述像素随时间在图像之间运动的方法, 本质上是估计像素在不同时刻图像中的运动。(希望解出像素到了下一刻的那个位置)
在这里插入图片描述
$\begin{cases}稀疏光流&{\color{#0F0}LK光流为代表}\\ 稠密光流&{\color{#0F0}HS光流为代表} \end{cases}$
在视觉SLAM中,可以用光流去追一些特征点,角点(一张图像上的部分像素),所以一般用的都是稀疏光流。

1.1、LK光流

设在t时刻位于(x,y)处的像素的灰度为I(x,y,t) ; 其中I(x,y,t)为在t时刻,x,y坐标的灰度值
在t+Δt时刻运动了(x+dx,y+dy)处,其灰度值为:I(x+dx,y+dy,t+dt)
我们想计算dx,dy
假设灰度不变I(x+dx,y+dy,t+dt)=I(x,y,t)
(是一个理想的假设,实际上可能会不成立)

$多元函数(x_k^1,x_k^2,....,x_k^n)处的泰勒展开公式:\\ f(x^1,x^2,....,x^n)=f(x_k^1,x_k^2,....,x_k^n)+\sum_{i=1}^n(x^i-x_k^i)f_{x^i}'(x_k^1,x_k^2,....,x_k^n)\\ +\frac{1}{2!}\sum_{i,j=1}^n(x^i-x_k^i)(x^j-x_k^j)f_{ij}^{''}(x_k^1,x_k^2,....,x_k^n)+O^n$

$I(x+dx,y+dy,t+dt)=I(x,y,t)\\ 对t+dt时刻的灰度进行泰勒一阶展开并保留一阶项\\ {\color{#F00} I(x+dx,y+dy,t+dt) ≈I(x,y,t)+\frac{\partial I }{\partial x}dx+\frac{\partial I }{\partial y}dy+\frac{\partial I }{\partial t}dt}\\~\\ 由灰度不变 \qquad \frac{\partial I }{\partial x}dx+\frac{\partial I }{\partial y}dy+\frac{\partial I }{\partial t}dt=0 \implies \frac{\partial I }{\partial x}\frac{dx}{dt}+\frac{\partial I }{\partial y}\frac{dy}{dt}=-\frac{\partial I }{\partial t}.\\ \Downarrow\\{\color{#F00} I_xu+I_yv=-I_t }\\ ~\\ \begin{matrix} \frac{\partial I}{\partial x}: 图像在x 方向上的梯度I_x.\\~\\ \frac{\partial I}{\partial y}: 图像在y 方向上的梯度I_y~\\ ~\\ \frac{\partial x}{\partial t}: x方向的速度u ~~~~~~~~~~~~~~~~~\\~\\ \frac{\partial x}{\partial t}: y方向的速度v ~~~~~~~~~~~~~~~~~\\~\\ \frac{\partial I}{\partial t}: 图像灰度关于时间的变化I_t\\ \end{matrix}$

${\color{#F00} I_xu+I_yv=-I_t }$
这里未知量是u和v, 上式为一个二元一次方程,使用一个像素点无法求出
–需要引用额外的约束
(不仅假设像素灰度值不变,而且要假定一个窗口内的像素具有相同的运动)
考虑一个大小为w×w的窗口,则含有w²数量个像素
$[I_x\quad I_y]_k\begin{bmatrix} u\\v \end{bmatrix}=-I_{tk}, \qquad k=1,2,...,w^2.$
超定方程,通过最小二乘解出来求得运动u,v
$A=\begin{bmatrix} [I_x,I_y]_1\\ \vdots[I_x,I_y]_k \end{bmatrix}, b=\begin{bmatrix} I_t1\\ \vdots \\I_{tk} \end{bmatrix}. \implies A\begin{bmatrix} u\\v \end{bmatrix}=-b. \implies \begin{bmatrix} u\\v \end{bmatrix}^*=-(A^TA)^{-1}A^Tb.$

$\qquad则e=Ax+b \qquad \\ \min||e||_2=\min(Ax+b)^T(Ax+b)=\min(x^TA^TAx+2 x^TA^Tb+b^Tb)\\ \frac{d||e||_2}{dx}=2A^TAx+2A^Tb=0\\ x=-(A^TA)^{-1}A^Tb$

问题:我们把光流写成了非线性优化问题,就必须假设优化的初始值靠近最优解.才能在一定程度上保证算法的熟练。如果相机运动较快,两章图像差异较为明显,那么单层图像光流法容易达到一个局部最小值。这种情况可以通过图像金字塔来改善。在这里插入图片描述
解决:图像金字塔是指对不同一个图像进行缩放,得到不同分辨率的图像, 如图8-2所示.
流程图:
由粗至精的好处在于,当原始图像的像素运动较大时,在金字塔顶层的图像看来,运动仍然在一个很小的范围内。例如,原始图像的特征点运动了20个像素,很容易由于图像非凸性导致优化困在极小值里。但现在假设没有缩放倍率0.5倍的金字塔,那么往上两层图像里,像素运动就只有5个像素了,这时结果就明显好于直接在原始图像上优化。
在这里插入图片描述

二、直接法

光流仅估计了像素间的平移,但是没有用到相机本身的集合结构(投影模型)以及考虑相机的旋转和图像的缩放
直接法考虑了这些信息

直接法的推导:
已知:三维点在第一个相机坐标系下的三维坐标 $P=\begin{pmatrix} X\\Y\\Z \end{pmatrix}$ 两张图像的灰度值; 三维点投影在第一章图像上的像素坐标p₁;
未知:图像1到图像2的位姿
假设:灰度不变假设 (光度不变)
目标: $\min_TJ(T)=\sum^N_{i=1}e_i^Te_i, \qquad e_i=I_1(p_{1.i})-I_2(p_{2,i}).$
思想:先初始化一个不准确的位姿,计算p₂,根据p₂和p₁的灰度值差异,不断迭代调整位姿

2.1 公式推导

像素坐标与相机坐标:
$p_1=\begin{bmatrix} u\\v\\1 \end{bmatrix}_1=\frac{1}{Z_1}KP.\\p_2=\begin{bmatrix} u\\v\\1 \end{bmatrix}_2=\frac{1}{Z_2}K(\underbrace{\fbox{RP+t}}_{\rm q} )=\frac{1}{Z_2}K(exp(\xi^\wedge)P)_{1:3}\\ 其中q是以p_2为相机坐标$

$\min_TJ(T)=\sum^N_{i=1}e_i^Te_i, \qquad e_i=I_1(p_{1.i})-I_2(p_{2,i}).$
q为了p在第二个相机坐标系下的坐标,u为它的像素坐标
$e(T)=I_1(p_1)-I_2(u),$
我们关心误差e是如何随着相机位姿T变化的,需要分析他们的导数关系
$\frac{\partial e}{\partial T}=-\frac{\partial I_2}{\partial u}\frac{\partial u}{\partial q}\frac{\partial q}{\partial \delta\xi}$

(1) $\frac{\partial I_2}{\partial u}为u处的像素梯度$
(2) $\frac{\partial u}{\partial q}为{\color{#00F}投影方程}关于{\color{#00F}相机坐标系下的三维点}的导数,记q=\begin{pmatrix}X\\Y\\Z \end{pmatrix}$
$u=\frac{f_xX+c_x}{Z}, v=\frac{f_yY+c_y}{Z}\Longrightarrow\frac{\partial u}{\partial q}=\begin{bmatrix} \frac{\partial u}{\partial X} &\frac{\partial u}{\partial Y}&\frac{\partial u}{\partial Z}\\~\\ \frac{\partial v}{\partial X} &\frac{\partial v}{\partial Y}&\frac{\partial v}{\partial Z} \end{bmatrix}=\begin{bmatrix} \frac{f_x}{Z} &0&-\frac{f_xX}{Z^2}\\~\\ 0&\frac{f_y}{Z}&-\frac{f_yY}{Z^2} \end{bmatrix}$
(3) $\frac{\partial q}{\partial \delta \xi}为变换后的三维点对变换的导数:\\ \frac{\partial q}{\partial \delta \xi}=[I,-q^\wedge].$
由(2)和(3)上式可知:
$\frac{\partial u}{\partial \delta \xi}=\begin{bmatrix} \frac{f_x}{Z} & 0&-\frac{f_xX}{Z^2}&-\frac{f_xXY}{Z^2}&f_x+\frac{f_xX^2}{Z^2}&-\frac{f_xY}{Z}\\~\\ 0 & \frac{f_y}{Z} & -\frac{f_yY}{Z^2} &-f_y-\frac{f_yY^2}{Z^2}&\frac{f_yXY}{Z^2}&\frac{f_yX}{Z'} \end{bmatrix}$
误差相对于李代数的雅可比矩阵:
$\color{#F00}J=-\frac{\partial I_2}{\partial u}\frac{\partial u}{\partial \delta \xi}.$