本讲介绍视觉SLAM的基本问题之一:
如何描述刚体在三维空间中的运动?
刚体运动的定义
两个坐标系之间的运动由一个旋转加上一个平移组成,这种运动称为刚体运动。相机运动就是一个刚体运动。刚体运动过程中,同一个向量在各个坐标系下的长度和夹角都不会发生变化。此时,我们说手机坐标系到世界坐标系之间,差了一个欧氏变换(Euclidean Transform)。欧氏变换由旋转和平移组成。
内积也可以描述向量间的投影关系。两个向量的内积结果和坐标系的选取是无关的。
外积的结果是一个向量,它的方向垂直于这两个向量,大小为|a||b|sin<a,b>,是两个向量张成的四边形的有向面积。
关于外积的反向对称矩阵(Skew-symmetric Matrix)没太搞懂。
坐标系间的欧氏变换
如果考虑运动的机器人,那么常见的做法是设定一个惯性坐标系(或者叫世界坐标系),可以认为它是固定不会动的。
旋转矩阵也叫方向余弦矩阵(Direction Cosine Matrix)。
旋转矩阵有一些特别的性质。事实上,它是一个行列式为1的正交矩阵。反之,行列式为1的正交矩阵也是一个旋转矩阵。
SO(n)是特殊正交群(Special Orthogonal Group)。这个集合由n维空间的旋转矩阵组成,特别的,**SO(3)**就是指三维空间的旋转。
由于旋转矩阵R为正交矩阵,它的逆(即转置)描述了一个相反的旋转。显然RT 刻画了一个相反的旋转。
变换矩阵和齐次坐标
矩阵T,即齐次坐标矩阵,称为变换矩阵。
关于变换矩阵T,它具有比较特别的结构:左上角为旋转矩阵,右侧为平移向量,左下角为0向量,右下角为1,。这种矩阵又称为特殊欧氏群(Special Euclidean Group) SE(3)。与SO(3)一样,求解该矩阵的逆表示一个反向的变换。
Eigen是一个C++开源线性代数库。特殊之处在于,它是一个纯用头文件搭建起来的库。所以不需要再用target_link_libraries语句将程序链接到库上。
旋转向量和欧拉角
任意旋转都可以用一个旋转轴和一个旋转角来刻画。我们可以使用一个向量,其方向与旋转轴一致,而长度等于旋转角。这种向量称为旋转向量(或轴角/角轴,Axis-Angle),只需一个三维向量即可描述旋转。
同样,对于变换矩阵,我们使用一个旋转向量和一个平移向量即可表达一次变换。这时的变量数正好是六维。
从旋转向量到旋转矩阵的转换过程由**罗德里格斯公式(Rodrigues’s Formula)**表明。
欧拉角提供了一种非常直观的方式来描述旋转——它使用了3个分离的转角,把一个旋转分解成3次绕不同的轴的旋转。
欧拉角当中比较常用的一种,便是用**“偏航-俯仰-滚转”(yaw-pitch-roll)** 3个角度来描述一个旋转。它等价于ZYX轴的旋转,因此就以ZYX轴为例。ZYX转角相当于把任意旋转分解成一下3个轴上的转角:
1. 绕物体的Z轴旋转,得到偏航角yaw
2. 绕旋转之后的Y轴旋转,得到俯仰角pitch
3. 绕旋转之后的X轴旋转,得到滚转角roll
此时,可以使用[r,p,y]T这样一个三维的向量描述任意旋转。 这里介绍的rpy角是比较常用的一种。
欧拉角的一个重大缺点是会碰到著名的万向锁问题(Gimbal Lock)。这被称为奇异性问题,这个问题在其他形式的欧拉角中也同样存在。因此欧拉角不适用于插值和迭代,往往只用于人机交互中,用来直观地分辨结果是否正确。
四元数
未完待续