《视觉SLAM十四讲》第三章阅读笔记（一）

最新推荐文章于 2024-07-17 22:40:17 发布

半熟芝士味

最新推荐文章于 2024-07-17 22:40:17 发布

阅读量434

点赞数 1

分类专栏： SLAM # 视觉SLAM十四讲阅读笔记文章标签：自动驾驶算法人工智能 slam

本文链接：https://blog.csdn.net/weixin_47552638/article/details/121002360

版权

SLAM 同时被 2 个专栏收录

33 篇文章 23 订阅

订阅专栏

视觉SLAM十四讲阅读笔记

5 篇文章 0 订阅

订阅专栏

《视觉SLAM十四讲》第三章阅读笔记（一）

第三章主要描述三维空间的刚体运动，主要的描述的方式为旋转矩阵、四元数和欧拉角。本文中将介绍三种之间的转换方式以及Eigen库和ROS系统中的关于旋转矩阵、四元数和欧拉角的具体表达和之间转换。，且本文都是基于右手系进行推导。

两个坐标系之间的变换

1.旋转矩阵

定义一个三维旋转矩阵R，用来表示两个坐标之间的坐标变换关系，同时也是一个行列式为1的正交矩阵，因此可以定义三维空间的李群SO（3）。
$SO(3)=\{\bm{R}\in\mathbb{R^{n\times{n}}}｜\bm{RR}^{T}=\bm{I},det(\bm{R})=1\}$
在SLAM系统里面，车体的旋转运动会体现到相机的旋转，当然前提是将车体和相机之间的连接看成刚性连接，意味着当相机测出旋转运动时，可以反推出车体的运动，从而求出车体的位姿。然而通常情况下，旋转矩阵不足以表达出车体的运动，在车辆行驶过程中，除了旋转还有平移运动，因此还需要引入平移向量t。则有：
$\bm{T}=\begin{bmatrix} \bm{R}&\bm{t} \\\ 0^{\bm{T}} & 1 \end{bmatrix}$
这里引入的是齐次坐标系，然而为何引入齐次坐标呢？首先需要解答的第一个问题是什么是齐次坐标，齐次坐标就是在原有坐标基础上再加一个维度，如：
$(x,y)\rightarrow (x,y,1)$
$(x,y,z)\rightarrow(x,y,z,1)$
如果直线l可以用直线方程ax+by+c=0来表示的话，该直线用向量表示的话，记做：
$l=(x,y,1)^{T}$
则直线的坐标可以设置成 $P = (x, y, 1)$ 直线方程则为两点之间的点乘也就是内积。
$ax+by+c\times1 =(a,b,c)^{T}(x,y,1)=l^{T}*P^{\prime}=0$
同样地，在三维空间内假设平面方程A为
$a x + b y + c z + d = 0 ， P = （ x ， y ， z ， 1 ）$
$ax+by+cz+d=(a,b,c,d)^{T}(x,y,z,1)=A^{T}*P^{\prime}=0$
从普通坐标转换成齐次坐标时
如果(x,y,z)是个点，则变为(x,y,z,1);
如果(x,y,z)是个向量，则变为(x,y,z,0)
从齐次坐标转换成普通坐标时
如果是(x,y,z,1)，则知道它是个点，变成(x,y,z);
如果是(x,y,z,0)，则知道它是个向量，仍然变成(x,y,z)
具体可见：齐次坐标的理解
使用齐次坐标可以将欧式变换中的加法转换为乘法，如二维平面点 $x = [u ， v]$ ，平移量为 $t = [t u, t v]$ ，变换后的点应为：
$x^{\prime}\rightarrow \begin{bmatrix} u ^{\prime}\\\ v^{\prime} \end{bmatrix}= \begin{bmatrix} u+t{u} \\\ v+t_{v} \end{bmatrix}=x+t$
将齐次坐标作为替代，重写写为：
$x^{\prime}\rightarrow \begin{bmatrix} u ^{\prime}\\\ v^{\prime}\\\ 1 \end{bmatrix}=\begin{bmatrix} 1 &0 &u\\\ 0 &1 &v\\\ 0&0 &1\end{bmatrix} \begin{bmatrix} u \\\ v\\\ 1 \end{bmatrix}=\bm{T}\bm{x}$

在三维空间内，SLAM存在存在着旋转和平移，考虑世界坐标系中的向量a，经过一次旋转（用 R 描述）和一次平移 t 后，得到了 a′，那么把旋转和平移合到一起，有：
$\bm{a}^{\prime}=\bm{R}\bm{a}+\bm{t}$
其中，t 称为平移向量。相比于旋转，平移部分只需把这个平移量加到旋转之后的坐标上，
显得非常简洁。通过上式，我们用一个旋转矩阵 R 和一个平移向量 t 完整地描述了一个欧氏空间的坐标变换关系。
引入齐次坐标和变换矩阵重写：
$\begin{bmatrix} \bm{a} ^{\prime}\\\ 1 \end{bmatrix}=\begin{bmatrix} \bm{R}&\bm{t} \\\ 0^{\bm{T}} & 1 \end{bmatrix}\begin{bmatrix} \bm{a} \\\ 1 \end{bmatrix}\triangleq \bm{T}\begin{bmatrix} \bm{a} \\\ 1 \end{bmatrix}$
同样地，特殊欧氏群为：
$SE(3)=\{\bm{T=\begin{bmatrix} \bm{R}&\bm{t} \\\ 0^{\bm{T}} & 1 \end{bmatrix}}\in\mathbb{R^{4\times4}}｜\bm{R}\in SO(3),t\in\mathbb{R}^{3}\}$

2.旋转向量

使用旋转矩阵来表示三维空间的变换存在以下缺点：
1.SO(3) 的旋转矩阵有九个量，但一次旋转只有三个自由度。因此这种表达方式是冗
余的。同理，变换矩阵用十六个量表达了六自由度的变换。
2.旋转矩阵自身带有约束：正交矩阵，且行列式为 1。变换矩阵也是如此。当
估计或优化一个旋转矩阵/变换矩阵时，这些约束会使得求解变得更困难。
引入一个新的概念:旋转向量，即用一个旋转轴和一个旋转角来刻画。关键关键问题在于旋转矩阵和旋转向量之间的转换。
接下来关于罗德里格斯公式（Rodrigues’s Formula）的推导。
首先给出推导的结果，即罗德里格斯公式（Rodrigues’s Formula ）。
$R=cos\theta\bm{I}+(1-cos\theta)\bm{nn^T}+sin\theta\bm{n^{\land}}$
使用旋转矩阵表示的R为
$R=\begin{bmatrix} r_{xx} &r_{xy} & r_{xz} \\\ r_{yx} & r_{yy} & r_{yz} \\\ r_{zx} & r_{zy} &r_{zz} \end{bmatrix}$
上述已经描述过，旋转矩阵为标准的正交矩阵且矩阵的行列式为1，下式表达：
$\bm{R}^{T}\bm{R}=\bm{R}^{-1}\bm{R}=\bm{E}$
$|\bm{R}|=1$
假设原坐标系基向量矩阵为 B，旋转后的坐标系基向量矩阵为 C。
$\bm{B}=[b_{x},b_{y},b{z}]=\begin{bmatrix} 1 &0 & 0 \\\ 0& 1 & 0 \\\ 0 & 0 &1\end{bmatrix}$
$\bm{C}=\bm{R}\bm{B}$
即
$\bm{C}=\begin{bmatrix} r_{xx} &r_{xy} & r_{xz} \\\ r_{yx} & r_{yy} & r_{yz} \\\ r_{zx} & r_{zy} &r_{zz} \end{bmatrix}[b_{x},b_{y},b{z}]$
假设一个单位向量
$n=[n_{x},n_{y},n_{z}]$
在这里插入图片描述
考虑向量旋转，其中 $v$ 作为原向量， $v_{rot}$ 为旋转后的向量。先通过点积得到 $v$ 在 $n$ 方向的平行分量 $v_{||}$ :
$v_{||}=(v\cdot n)n$
再通过叉乘得到与 $k$ 正交的两个向量 $v_{\perp}$ 与 $w$ 。
$v_{\perp} = v - v_{\parallel } = v - (v \cdot k)k = -k \times (k \times v) \cdot \cdot \cdot \cdot \cdot \cdot$
$\times v$
根据图中可以得出：
$v_{rot}=v_{\parallel}+cos(\theta)v_{\perp}+sin(\theta)w$
反对称矩阵可见反对成矩阵
则 $n$ 的反对称矩阵为：
$n^{\land}=\begin{bmatrix} 0&-n_z & n_{y} \\\ n_{z} & 0 & -n_{x} \\\ -n_{y} & n_{x} &0 \end{bmatrix}$ 其中
$n\times v=n^{\land}v$
因此，可以得到以下公式
$v_{\parallel}=v+n\times (n\times v)$
所以可以得到
$v_{rot}=v+n\times (n\times v)-cos(\theta)k\times (k\times v)+sin(\theta)k\times v$
根据叉积矩阵性质：
$v_{rot}=v+(1-cos(\theta)(n^{\land})^2v+sin(\theta)(n^{\land})^2v$
$v_{rot}=(I+(1-cos(\theta))(n^{\land})^2v+sin(\theta)(n^{\land})^2v$
将 $B$ , $C$ 代入可知：
$B=(I+(1-cos(\theta))(n^{\land})^2+sin(\theta)n^{\land})C \Leftrightarrow \bm{R}=I+(1-cos(\theta))(n^{\land})^2+sin(\theta)n^{\land}$
同时，反过来计算，从旋转矩阵到旋转向量的转换。对于转角 $\theta$ ，对每一项取迹有
$tr(\bm{R})=cos\theta tr(\bm{I})+(1-cos\theta )tr (\bm{nn}^{T})+sin\theta tr(\bm{n}^{\land})=3cos\theta +(1-cos\theta)=1+2cos\theta$
符号 $^\land$ 为反对称矩阵转换符。
因此：
$\theta=arcos(\frac{tr(\bm{R})-1}{2})$
关于转轴 $n$ ，由于旋转轴上的向量在旋转后不发生改变，说明：
$\bm{Rn}=\bm{n}$

参考：
罗德里格斯公式理解、推导

半熟芝士味

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《视觉SLAM十四讲》第三章阅读笔记（一）

《视觉SLAM十四讲》第三章阅读笔记第三章主要描述三维空间的刚体运动，主要的描述的方式为旋转矩阵、四元数和欧拉角。本文中将介绍三种之间的转换方式以及Eigen库和ROS系统中的关于旋转矩阵、四元数和欧拉角的具体表达和之间转换。，且本文都是基于右手系进行推导。...
复制链接

扫一扫