视觉SLAM十四讲 3-三维空间刚体运动

最新推荐文章于 2023-03-26 12:50:11 发布

Nismilesucc

最新推荐文章于 2023-03-26 12:50:11 发布

阅读量1.7k

点赞数

分类专栏： SLAM 文章标签： SLAM

HUIKI

本文链接：https://blog.csdn.net/Nismilesucc/article/details/124040858

版权

SLAM 专栏收录该内容

7 篇文章 6 订阅

订阅专栏

蓝色
紫色
红色

一、前言

本章简要介绍 三维世界中刚体 运动的描述方式：旋转矩阵、旋转向量、欧拉角、四元数等。

二、SLAM问题的数学表述

用数学语言来描述：小萝卜正携带着某种传感器在未知环境里运动

相机：在 某些时刻 采集数据 连续时间的运动 => 离散时刻

对于小萝卜： $t = 1, . . ., K$ 时刻，小萝卜在各个时刻的位置： $x_1,...,x_K$ => 小萝卜的轨迹

对于地图：设置许多路标 (Landmark），每个时刻，传感器会测量到一部分路标点，得到他们的观测数据。

N 个路标点： $y_1,...,y_N$

运动：从 k = 1时刻到 k时刻，小萝卜的位置x 是如何变化的。

机器人会携带一个 测量自身运动 的传感器（eg.码盘或惯性传感器），这个传感器可以测量有关运动的读数，但不一定直接是 位置之差，还可能是 加速度、角速度 等信息。抽象成数学模型：(运动方程）

在这里插入图片描述
$u_k$ 是运动传感器的读数（输入）， $w_k$ 是噪声。

观测：假设小萝卜在 k时刻，于 $x_k$ 处探测到了某一个路标 $y_j$ ，如何用数学语言描述。

观测方程： 描述当小萝卜在 $x_k$ 位置上看到某个路标点 $y_j$ ，产生了一个观测数据 $z_{k,j}$ 。 $v_{k,j}$ 是观测里的噪声。
在这里插入图片描述

参数化 Parameterization

位姿：位置+姿态

如果小萝卜在平面中运动，那么它的位姿由 两个位置 和 一个转角 来描述，即 $x_k=[x,y,θ]^T_k$ 。同时，运动传感器能够测量到小萝卜在每两个时间间隔位置和转角的变化量 $u_k=[Δx,Δy,Δθ]^T_k$ ，则运动方程可具体化为：

在这里插入图片描述
上述是简单的 线性关系 。但并不是所有的传感器都直接能测量出 位移和角度变化 ，所以会有更复杂的运动方程，需要进行动力学分析。

关于观测方程，比方说小萝卜携带着一个 二维激光传感器。我们知道激光传感器观测一个2D 路标点时，能够测到两个量：路标点与小萝卜本体之间的 距离r 和夹角ϕ 。我们记 路标点 为 $y=[p_x,p_y]^T$ （为保持简洁，省略了下标），观测数据 为 $z=[r,ϕ]^T$ ，那么观测方程就具体化为：
在这里插入图片描述

视觉SLAM的问题表述

视觉SLAM：传感器是相机。

观测方程就是 “对路标点拍摄后，得到了图像中的像素” 的过程。针对不同的传感器，这两个方程有不同的参数化形式。

如果我们保持通用性，把它们取成通用的抽象形式。则SLAM 过程可总结为两个基本方程：
在这里插入图片描述
这两个方程描述了最基本的SLAM 问题：当我们知道运动测量的读数u，以及传感器的读数z 时，如何求解定位问题（估计 位置x ）和建图问题（估计 路标y ）？

SLAM问题建模成 状态估计问题 ［通过带有噪声的测量数据，估计内部的、隐藏着的 状态变量]

三、线性代数相关知识

1. 点和向量、坐标系

刚体：内部任意两点间距离保持不变，不易发生形变的物体。

刚体变换：由旋转和平移组成

存在疑惑：刚体配准和非刚体配准区别？

在西电的一篇硕士论文第五章里看到这样的表述：

“非刚性物体的图像配准比刚体物体的复杂，因为非刚性物体图像配准中的变换必须考虑 非线性形变 ，这种形变可能是全局的也可能是局部的，也可能二者都有。”

三维空间由3个轴组成，所以空间点的位置可由3个坐标 [x,y,z] 指定。 `注意区别坐标和向量`

向量只有在指定坐标系之后才可以谈论该向量在 此坐标系下的坐标，即找到 若干个实数 对应这个向量。

当指定一个坐标系，即给定一个线性空间的基 $e_1,e_2,e_3)$ ，向量a 在这组基下的坐标：

在这里插入图片描述
$a,b ∈ R^3$

向量内积 描述向量间的投影关系：
向量外积 可表示向量的旋转：两个向量张成的四边形的有向面积，大小为 |a||b|sin<a,b>，方向垂直于这两个向量构成的平面

把 a 写成反对称矩阵(Skew-symmetric)，变成 a^b (线性运算)

在这里插入图片描述
a 旋转到 b，可以由旋转向量 w 来描述，w 即是 a×b，其大小由 a 和 b 的夹角大小决定。

2. 坐标系间的欧氏变换

坐标系之间的变换关系：旋转和平移

惯性坐标系 / 世界坐标系 => 固定不动 $x_W,y_W,z_W$

移动坐标系 => 相机或机器人 $x_C,y_C,z_C$

相机视野中某个向量 $\mathbf p$ ，它的坐标为 $\mathbf p_\mathbf c$ ，而从世界坐标系下看，它的坐标 $\mathbf p_\mathbf w$ 。这两个坐标之间的转换过程如下：

该点在相机坐标系下的 坐标值
根据 相机位姿 把坐标转换到世界坐标系中
该坐标变换由 矩阵 T 来描述

四、旋转的表达

欧式变换：同一个向量在各个坐标系下的长度和夹角都不会发生变化 平移和旋转

1. 旋转矩阵

设某个单位正交基 $e_1 , e_2 , e_3 )$ 经过一次旋转，变成了 $e_1' , e_2' , e_3')$ 。那么，对于同一个向量 a（该向量并没有随着坐标系的旋转而发生运动），它在两个坐标系下的坐标为 $a_1 , a_2 , a_3 ]^T$ 和 $a_1' , a_2' , a_3' ]^T$ 。

在这里插入图片描述
为了描述两个坐标之间的关系，上式左右同时左乘 $\begin{bmatrix} e_1^T\\ e_2^T\\ e_3^T \end{bmatrix}$ :

在这里插入图片描述
旋转矩阵 R：描述旋转本身 由两组基之间的内积组成，刻画了旋转前后同一个向量的坐标变换关系。只要旋转是一样的，那么这个矩阵也是一样的。

性质：旋转矩阵 ⇔ 行列式为1的正交矩阵

正交矩阵： $A^T=A^{-1}$

定义：设A是一个n 阶方阵，如果有 $AA^T=I$ ，则A是正交矩阵。
在这里插入图片描述

特殊正交群（Special Orthogonal Group） $S O (n)$

旋转矩阵的集合定义：

在这里插入图片描述
$S O (3)$ 表示三维空间的旋转。

相反的旋转

由于旋转矩阵R 是正交矩阵，它的 逆 $R^{-1}$ / 转置 $R^T$ 描述了一个相反的旋转。
在这里插入图片描述

完整的欧式空间坐标变换

考虑世界坐标系中的向量 a，经过一次旋转（用 R 描述）和一次平移 t 后，得到了 a‘ ，那么把旋转和平移合到一起，有：
在这里插入图片描述
但是这样的变换关系不是一个 线性关系 ，多次变换之后会过于复杂。

在这里插入图片描述
引入 齐次坐标和变换矩阵T 重写式 (3.8)：

在这里插入图片描述
两次变换的累加变为：

特殊欧氏群（Special Euclidean Group） $S E (n)$

在这里插入图片描述
与 $S O (3)$ 一样，求解 该矩阵的逆 表示一个反向的变换：

2. 旋转向量

变换矩阵 $T$ $D o F (T) = 6$ (1+1)*3 三个维度上的旋转+平移

旋转矩阵 $R$ $D o F (R) = 3$ 1*3

矩阵表示法的缺点：

$S O (3)$ 的旋转矩阵有 九个量 $(3 * 3)$ ，但一次旋转只有 三个自由度 。变换矩阵用 十六个量 $(4 * 4)$ 表达了 六自由度 的变换。 冗余
旋转矩阵自身带有约束：它必须是个正交矩阵，且行列式为 1。 估计或优化一个 R/T 时，求解变得更困难