《视觉SLAM十四讲》读书笔记（二）

最新推荐文章于 2023-03-24 22:24:30 发布

家家的快乐空间

最新推荐文章于 2023-03-24 22:24:30 发布

阅读量413

点赞数 2

分类专栏：视觉SLAM十四讲读书笔记文章标签： slam

本文链接：https://blog.csdn.net/m0_38144614/article/details/121002648

版权

视觉SLAM十四讲读书笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

李群与李代数

引入李群与李代数的原因：旋转矩阵自身是带有约束的（正交且行列式为1）.它们作为优化变量时，会引入额外的约束，使优化变得困难。通过李群——李代数间的转换关系，我们希望把位姿估计变成无约束的优化问题，简化求解方式。

4.1 李群与李代数基础

三维旋转矩阵构成了特殊正交群SO(3)
变换矩阵构成了特殊欧式群SE(3)
$\begin{array}{l} \mathrm{SO}(3)=\left\{\boldsymbol{R} \in \mathbb{R}^{3 \times 3} | \boldsymbol{R} \boldsymbol{R}^{\mathrm{T}}=\boldsymbol{I}, \operatorname{det}(\boldsymbol{R})=1\right\} \\ \mathrm{SE}(3)=\left\{\boldsymbol{T}=\left[\begin{array}{ll} \boldsymbol{R} \boldsymbol{t} \\ \mathbf{0}^{\mathrm{T}} 1 \end{array}\right] \in \mathbb{R}^{4 \times 4} | \boldsymbol{R} \in \mathrm{SO}(3), \boldsymbol{t} \in \mathbb{R}^{3}\right\} \end{array}$
乘法对应着旋转或变换的集合，两个旋转矩阵相乘表示做了两次旋转。对于这种只有一个（良好的，封闭的）运算的集合，我们称之为群。

4.1.1 群

群的定义：群是一种集合加上一种运算的代数结构。
运算对象：集合记作 $A$ 。
运算符：运算记作 $\cdot$
群的标记： $G=(A,\cdot)$

群对运算的要求（封结幺逆 = 丰俭由你）：

封闭性： ${\forall a_{1}, a_{2} \in A, \ \ \ \ \ a_{1} \cdot a_{2} \in A}$ .
结合律: $\forall a_{1}, a_{2}, a_{3} \in A, \ \ \ \ \ \left(a_{1} \cdot a_{2}\right) \cdot a_{3}=a_{1} \cdot\left(a_{2} \cdot a_{3}\right)}$ .
幺元: $\exists a_{0} \in A, \ \ \ \ \ }$ s.t. $\forall a \in A, \ \ \ \ \ a_{0} \cdot a=a \cdot a_{0}=a}$ .
逆: $\forall a \in A, \ \ \ \ \ \exists a^{-1} \in A, \ \ \ \ \ }$ s.t. $\cdot a^{-1}=a_{0}}$ .

李群的定义：李群是指具有连续（光滑）性质的群。

参考：旋转之十一 - SE(3) 和 se(3)

4.1.2 李代数的引出

$\boldsymbol{R}$ 是某个相机的旋转，它会随时间连续地变化，即为时间的函数： $\boldsymbol{R}(t)$ ，有：
$\boldsymbol{R}(t)\boldsymbol{R}(t)^T=\boldsymbol{I}\tag{4.5}$
在等式两边对时间求导，得到
$\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}+\boldsymbol{R}(t) \dot{\boldsymbol{R}}(t)^{\mathrm{T}}=0$
整理得
$\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}=-\left(\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}\right)^{\mathrm{T}}\tag{4.6}$
$\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}$ 是一个反对称矩阵。 $^\wedge$ 符号可以将一个向量转成反对称矩阵。反对称矩阵，也能找到唯一与之对应的向量。
$\boldsymbol{a}^{\wedge}=\boldsymbol{A}=\left[\begin{array}{ccc} 0 & -a_{3} & a_{2} \\ a_{3} & 0 & -a_{1} \\ -a_{2} & a_{1} & 0 \end{array}\right], \boldsymbol{A}^{\vee}=\boldsymbol{a}\tag{4.7}$
于是，由于 $\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}$ 是一个反对称矩阵，我们可以找到一个三维向量 $\boldsymbol{\phi}(t)\in\mathbb{R}^3$ 与之对应：
$\dot{\boldsymbol{R}}(t) \boldsymbol{R}(t)^{\mathrm{T}}=\boldsymbol{\phi}(t)^{\wedge}$

等式两边右乘 ${\boldsymbol{R}(t)}$ , 由于 ${\boldsymbol{R}}$ 为正交阵, 可以消去左边的 ${\boldsymbol{R}}^T$
$\dot{\boldsymbol{R}}(t)=\boldsymbol{\phi}(t)^{\wedge} \boldsymbol{R}(t)=\left[\begin{array}{ccc} 0 & -\phi_{3} & \phi_{2} \\ \phi_{3} & 0 & -\phi_{1} \\ -\phi_{2} & \phi_{1} & 0 \end{array}\right] \boldsymbol{R}(t)\tag{4.8}$
旋转矩阵的导数：只需左乘一个 $\boldsymbol{\phi}(t)^{\wedge}$ 即可。考虑 $t_0=0$ 时，设此时旋转矩阵为 $\boldsymbol{R}(0)=\boldsymbol{I}$ 。按照导数定义，可以把 $\boldsymbol{R}(t)$ 在 $t = 0$ 附近进行一阶泰勒展开：
$\boldsymbol{R}(t) \approx \boldsymbol{R}\left(t_{0}\right)+\dot{\boldsymbol{R}}\left(t_{0}\right)\left(t-t_{0}\right) \\ =\boldsymbol{I}+\boldsymbol{\phi}\left(t_{0}\right)^{\wedge}\boldsymbol{R}(t_{0})(t)\\ =\boldsymbol{I}+\boldsymbol{\phi}\left(t_{0}\right)^{\wedge}(t)\tag{4.9}$
$\boldsymbol{\phi}$ 的定义：在SO(3)原点附近的正切空间，它反映了 $\boldsymbol{R}$ 的导数性质

在 $t_0$ 附近，设 $\boldsymbol{\phi}$ 保持为常数 $\boldsymbol{\phi}(t_0)=\boldsymbol{\phi}_0$ 。根据式(4.8)，有
$\dot{\boldsymbol{R}}(t)=\boldsymbol{\phi}\left(t_{0}\right)^{\wedge} \boldsymbol{R}(t)=\boldsymbol{\phi}_{0}^{\wedge} \boldsymbol{R}(t)$
上式是一个关于 $\boldsymbol{R}$ 的微分方程，而且有初始值 $\boldsymbol{R}(0)=\boldsymbol{I}$ ，解得
$\boldsymbol{R}(t)=\exp \left(\boldsymbol{\phi}_{0}^{\wedge} t\right)\tag{4.10}$
式(4.10)推导：

$\dot{\boldsymbol{R}}(t)=\boldsymbol{\phi}\left(t_{0}\right)^{\wedge} \boldsymbol{R}(t)= \boldsymbol{\phi}_{0}^{\wedge} \boldsymbol{R}(t)=\frac{d\boldsymbol{R}(t)}{dt}$
方法1. 转为一阶齐次线性微分方程标准形式
$\frac{d\boldsymbol{R}(t)}{dt}-\boldsymbol{\phi}_{0}^{\wedge} \boldsymbol{R}(t)=0$
得到通解形式：
$\boldsymbol{R}(t)=\exp \left(\boldsymbol{\phi}_{0}^{\wedge} t\right)$
方法2. 或者逐步推导，由
$\frac{d\boldsymbol{R}(t)}{R(t)}=\boldsymbol{\phi}_{0}^{\wedge}{dt}$
$ln|\boldsymbol{R}(t)|=\int \boldsymbol{\phi}_{0}^{\wedge}{dt}+C$
$|\boldsymbol{R}(t)|=e^{\boldsymbol{\phi}_{0}^{\wedge}{dt}+C}=e^Ce^{\boldsymbol{\phi}_{0}^{\wedge}{dt}}=\boldsymbol{R}(0)e^{\boldsymbol{\phi}_{0}^{\wedge}{dt}}$
由于初始值 $\boldsymbol{R}(0)=\boldsymbol{I}$ ，因此同样可以得到结果
$\boldsymbol{R}(t)=\exp \left(\boldsymbol{\phi}_{0}^{\wedge} t\right)$

总结

给定某时刻的 $\boldsymbol{R}$ ，我们就能求得一个 $\boldsymbol{\phi}$ ，它描述了 $\boldsymbol{R}$ 在局部的倒数关系。与 $\boldsymbol{R}$ 对应的 $\boldsymbol{\phi}$ 正是对应到 $S O (3)$ 的李代数 $\mathfrak{s o}(3)$
李群与李代数间的指数/对数映射，给出了向量 $\boldsymbol{\phi}$ 与 $\boldsymbol{R}$ 一一对应的关系。
有朋友可能还在困惑，到底 $\boldsymbol{\phi}$ 怎么求取。实际上，利用式(4.9)，只需要知道 $\boldsymbol{R}(t)$ 和 $\boldsymbol{R}(t_0)$ 即可求得 $\boldsymbol{\phi}$ 。

4.1.3 李代数的定义

李代数由一个集合 $\mathbb{V}$ 、一个数域 $\mathbb{F}$ 和一个二元运算 $[,]$ 组成。如果它们满足以下几条性质，则称 $(\mathbb{V},\mathbb{F},[,])$ 为一个李代数，记作 $\mathfrak{g}$ 。

封闭性： $\quad \forall \boldsymbol{X}, \boldsymbol{Y} \in \mathbb{V},[\boldsymbol{X}, \boldsymbol{Y}] \in \mathbb{V} .$
双线性： $\forall \boldsymbol{X}, \boldsymbol{Y}, \boldsymbol{Z} \in \mathbb{V}, a, b \in \mathbb{F}$ , 有
$\boldsymbol{X}+b \boldsymbol{Y}, \boldsymbol{Z}]=a[\boldsymbol{X}, \boldsymbol{Z}]+b[\boldsymbol{Y}, \boldsymbol{Z}], \quad[\boldsymbol{Z}, a \boldsymbol{X}+b \boldsymbol{Y}]=a[\boldsymbol{Z}, \boldsymbol{X}]+b[\boldsymbol{Z}, \boldsymbol{Y}]$
自反性： $\quad \forall \boldsymbol{X} \in \mathbb{V},[\boldsymbol{X}, \boldsymbol{X}]=\mathbf{0} .$
雅可比等价： $\quad \forall \boldsymbol{X}, \boldsymbol{Y}, \boldsymbol{Z} \in \mathbb{V},[\boldsymbol{X},[\boldsymbol{Y}, \boldsymbol{Z}]]+[\boldsymbol{Z},[\boldsymbol{X}, \boldsymbol{Y}]]+[\boldsymbol{Y},[\boldsymbol{Z}, \boldsymbol{X}]]=\mathbf{0} .$

其中二元运算被称为李括号。作为例子，三维向量 $\mathbb{R}^3$ 上定义的叉积 $\times$ 是一种李括号，因此 $\mathfrak{g}=(\mathbb{R}^3,\mathbb{R},\times)$ 构成了一种李代数。

4.1.4 李代数 $\mathfrak{s o}(3)$

前面提到的 $\boldsymbol{\phi}$ ，事实上是一种李代数。SO(3)对应的李代数是定义在 $\mathbb{R}^3$ 上的向量，我们记作 $\boldsymbol{\phi}$ 。每个 $\boldsymbol{\phi}$ 都可以生成一个反对称矩阵：
$\boldsymbol{\Phi}=\phi^{\wedge}=\left[\begin{array}{ccc} 0 & -\phi_{3} & \phi_{2} \\ \phi_{3} & 0 & -\phi_{1} \\ -\phi_{2} & \phi_{1} & 0 \end{array}\right] \in \mathbb{R}^{3 \times 3}\tag{4.11}$
在此定义下，两个向量 $\boldsymbol{\phi}_1$ , $\boldsymbol{\phi}_2$ 的李括号为：
$\left[\boldsymbol{\phi}_{1}, \boldsymbol{\phi}_{2}\right]=\left(\boldsymbol{\Phi}_{1} \boldsymbol{\Phi}_{2}-\boldsymbol{\Phi}_{2} \boldsymbol{\Phi}_{1}\right)^{\vee}\tag{4.12}$
由于向量 $\boldsymbol{\phi}$ 与反对称矩阵是一一对应的, 在不引起歧义的情况下, 就说 $\mathfrak{s o}(3)$ 的元素是三维向量或者三维反对称矩阵, 不加区别:
$\mathfrak{s o}(3)=\left\{\phi \in \mathbb{R}^{3}, \boldsymbol{\Phi}=\phi^{\wedge} \in \mathbb{R}^{3 \times 3}\right\}\tag{4.13}$
$\mathfrak{s o}(3)$ 是一个由三维向量组成的集合, 每个向量对应一个反对称矩阵, 可以用于表达旋转矩阵的导数。它与 $\mathrm{SO}(3)$ 的关系由指数映射给定:
$\boldsymbol{R}=\exp \left(\boldsymbol{\phi}^{\wedge}\right)\tag{4.14}$
由于 $\phi$ 与反对称矩阵关系很紧密，在不引起歧义的情况下，就说 $\mathfrak{s o}(3)$ 的元素是3维向量或者3维反对称矩阵，不加区别：
$\mathfrak{s o}(3)=\left\{\Phi=\phi^{\wedge} \in \mathbb{R}^{3 \times 3} \mid \phi \in \mathbb{R}^{3}\right\}$

4.1.5 李代数 $\mathfrak{s e}(3)$

对于SE(3)，它也有对应的李代数 $\mathfrak{s e}(3)$ 。 $\mathfrak{s e}(3)$ 位于 $\mathbb{R}^6$ 空间中：
$\mathfrak{s e}(3)=\left\{\boldsymbol{\xi}=\left[\begin{array}{l} \rho \\ \phi \end{array}\right] \in \mathbb{R}^{6}, \boldsymbol{\rho} \in \mathbb{R}^{3}, \phi \in \mathfrak{s o}(3), \boldsymbol{\xi}^{\wedge}=\left[\begin{array}{cc} \phi^{\wedge} & \rho \\ 0^{\mathrm{T}} & 0 \end{array}\right] \in \mathbb{R}^{4 \times 4}\right\}$
我们把每个 $\mathfrak{s e}(3)$ 元素记作 $\boldsymbol{\xi}$ , 它是一个六维向量。前三维为平移（但含义与变换矩阵中的平移不同, 分析见后 ), 记作 $\rho$ ; 后三维为旋转, 记作 $\phi$ , 实质上是 $\mathfrak{s o}(3)$ 元素 $^{\odot}$ 。同时, 我们拓展了 $^{\wedge}$ 符号的含义。在 $\mathfrak{s e}(3)$ 中, 同样使用 $^{\wedge}$ 符号, 将一个六维向量转换成四维矩阵, 但这里不再表示反对称:
$\boldsymbol{\xi}^{\wedge}=\left[\begin{array}{ll} \phi^{\wedge} & \rho \\ \mathbf{0}^{\mathrm{T}} & 0 \end{array}\right] \in \mathbb{R}^{4 \times 4}$
我们仍使用 $^{\wedge}$ 和 $\vee$ 符号指代 “从向量到矩阵”和 “从矩阵到向量”的关系, 以保持和 $\mathfrak{s o}(3)$ 上的一致性。它们依旧是一一对应的。读者可以简单地把 $\mathfrak{s e}(3)$ 理解成 “由一个平移加上一个 $\mathfrak{s o}(3)$ 元素构成的向量” ( 尽管这里的 $\rho$ 还不直接是平移)。同样, 李代数 $\mathfrak{s e}(3)$ 也有类似于 $\mathfrak{s o}(3)$ 的李括号：
$\left[\boldsymbol{\xi}_{1}, \boldsymbol{\xi}_{2}\right]=\left(\boldsymbol{\xi}_{1}^{\wedge} \boldsymbol{\xi}_{2}^{\wedge}-\boldsymbol{\xi}_{2}^{\wedge} \boldsymbol{\xi}_{1}^{\wedge}\right)^{\vee}$

4.2 指数与对数映射

4.2.1 SO(3)上的指数映射

首先，回忆任意矩阵的指数映射。它可以写成一个泰勒展开，但是只有在收敛的情况下才会有结果，其结果仍是一个矩阵。
$\exp(\mathbf{A}) = \sum\limits_{n = 0}^\infty {\frac{1}{{n!}}{ \mathbf{A}^n}}\tag{4.18}$
同样地，对 $\mathfrak{so}(3)$ 中任意一元素 $\phi$ ，我们亦可按此方式定义它的指数映射：
$\exp(\mathbf{\phi}^\wedge) = \sum\limits_{n = 0}^\infty {\frac{1}{{n!}}{ (\mathbf{\phi}^{\wedge})^n}}\tag{4.19}$
现在我们来仔细看看它的含义。由于 $\phi$ 是三维向量，我们可以定义它的模长和它的方向，分别记作 $\mathbf{\theta}$ 和 $\mathbf{a}$ （ $|\mathbf{a}|=1$ ），那么按照上式，可以推出式(4.20)，注意中间使用了上面讲到了两个反对称矩阵的性质：

反对称矩阵有一些重要的性质，重点包括以下两条：
$\phi \phi^{T}=\phi^{\wedge} \phi^{\wedge}+\|\phi\|^{2} \mathbf{I}_{3 \times 3}$
当 $\phi$ 为单位向量时，进而有：
$\phi^{\wedge} \phi^{\wedge}=\left[\begin{array}{ccc} -a_{2}^{2}-a_{3}^{2} & a_{1} a_{2} & a_{1} a_{3} \\ a_{1} a_{2} & -a_{1}^{2}-a_{3}^{2} & a_{2} a_{3} \\ a_{1} a_{3} & a_{2} a_{3} & -a_{1}^{2}-a_{2}^{2} \end{array}\right]=\phi \phi^{T}-\mathbf{I}$
以及
$\phi^{\wedge} \phi^{\wedge} \phi^{\wedge}=\phi^{\wedge}(\phi\phi^T-\mathbf{I})=-\phi^{\wedge}$

$\begin{aligned} \exp \left(\phi^{\wedge}\right) &=\exp \left(\theta \boldsymbol{a}^{\wedge}\right)=\sum_{n=0}^{\infty} \frac{1}{n !}\left(\theta \boldsymbol{a}^{\wedge}\right)^{n} \\ &=\boldsymbol{I}+\theta \boldsymbol{a}^{\wedge}+\frac{1}{2 !} \theta^{2} \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}+\frac{1}{3 !} \theta^{3} \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}+\frac{1}{4 !} \theta^{4}\left(\boldsymbol{a}^{\wedge}\right)^{4}+\cdots \\ &=\boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}-\boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}+\theta \boldsymbol{a}^{\wedge}+\frac{1}{2 !} \theta^{2} \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}-\frac{1}{3 !} \theta^{3} \boldsymbol{a}^{\wedge}-\frac{1}{4 !} \theta^{4}\left(\boldsymbol{a}^{\wedge}\right)^{2}+\cdots \\ &=\boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}+\underbrace{\left(\theta-\frac{1}{3 !} \theta^{3}+\frac{1}{5 !} \theta^{5}-\cdots\right)}_{\sin \theta} \boldsymbol{a}^{\wedge}-\underbrace{\left(1-\frac{1}{2 !} \theta^{2}+\frac{1}{4 !} \theta^{4}-\cdots\right)}_{\cos \theta} \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge} \\ &=\boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}+\boldsymbol{I}+\sin \theta \boldsymbol{a}^{\wedge}-\cos \theta \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge} \\ &=(1-\cos \theta) \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge}+\boldsymbol{I}+\sin \theta \boldsymbol{a}^{\wedge} \\ &=\cos \theta \boldsymbol{I}+(1-\cos \theta) \boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}+\sin \theta \boldsymbol{a}^{\wedge} \end{aligned}\tag{4.20}$

式(4.20)详细推导过程（实际上也是罗德里格斯公式的推导过程）：

先再次观察 so(3)，so(3) 中的元素可以看成矩阵，这个矩阵为反对称矩阵，我们用 $\Omega$ 来表示:

$\Omega=[\boldsymbol{\omega}]_{x}=\left[\begin{array}{ccc} 0 & -\omega_{3} & \omega_{2} \\ \omega_{3} & 0 & -\omega_{1} \\ -\omega_{2} & \omega_{1} & 0 \end{array}\right]$

这个矩阵可以看成是
$E_{1}=\left[\begin{array}{ccc}0 & 0 & 0 \\ 0 & 0 & -1 \\ 0 & 1 & 0\end{array}\right], E_{2}=\left[\begin{array}{ccc}0 & 0 & 1 \\ 0 & 0 & 0 \\ -1 & 0 & 0\end{array}\right], E_{3}=\left[\begin{array}{ccc}0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0\end{array}\right]$
组合而成, $\Omega=\omega_{1} E_{1}+\omega_{2} E_{2}+\omega_{3} E_{3}$ 也就是:
$\begin{aligned} &\boldsymbol{\omega} \in R^{3} \\ \omega_{1} E_{1}+\omega_{2} E_{2}&+\omega_{3} E_{3} \in s o(3) \end{aligned}$
观察 $\boldsymbol{\omega}=\left[\begin{array}{l}\omega_{1} \\ \omega_{2} \\ \omega_{3}\end{array}\right]$ , 作为向量, 它的模长:
$\begin{array}{c} \theta^{2}=\omega_{1}^{2}+\omega_{2}^{2}+\omega_{3}^{2} \\ \theta^{2}=\left[\begin{array}{lll} \omega_{1} & \omega_{2} & \omega_{3} \end{array}\right] \cdot\left[\begin{array}{c} \omega_{1} \\ \omega_{2} \\ \omega_{3} \end{array}\right]=\omega^{T} \boldsymbol{\omega} \end{array}$
计算 $\Omega^{n}, n=1,2, \ldots$ :

$\begin{array}{c} \Omega^{0}=I \\ \Omega=\left[\begin{array}{ccc} 0 & -\omega_{3} & \omega_{2} \\ \omega_{3} & 0 & -\omega_{1} \\ -\omega_{2} & \omega_{1} & 0 \end{array}\right] \\ \Omega^{2}=\left[\begin{array}{ccc} 0 & -\omega_{3} & \omega_{2} \\ \omega_{3} & 0 & -\omega_{1} \\ -\omega_{2} & \omega_{1} & 0 \end{array}\right]\left[\begin{array}{ccc} 0 & -\omega_{3} & \omega_{2} \\ \omega_{3} & 0 & -\omega_{1} \\ -\omega_{2} & \omega_{1} & 0 \end{array}\right]=\left[\begin{array}{ccc} -\omega_{3}^{2}-\omega_{2}^{2} & \omega_{1} \omega_{2} & \omega_{1} \omega_{3} \\ \omega_{2} \omega_{1} & -\omega_{3}^{2}-\omega_{1}^{2} & \omega_{2} \omega_{3} \\ \omega_{3} \omega_{1} & \omega_{2} \omega_{3} & -\omega_{1}^{2}-\omega_{2}^{2} \end{array}\right] \end{array}$
由于我们知道反对称矩阵的通用性质：
$\phi \phi^{T}=\phi^{\wedge} \phi^{\wedge}+\|\phi\|^{2} \mathbf{I}_{3 \times 3}$
$\phi^{\wedge} \phi^{\wedge} =\phi \phi^{T}-\|\phi\|^{2} \mathbf{I}_{3 \times 3}$
左右两边左乘一个 $\phi^{\wedge}$ ：
$\phi^{\wedge}\phi^{\wedge} \phi^{\wedge} =\phi^{\wedge}\phi \phi^{T}-\|\phi\|^{2} \phi^{\wedge}$
由于 $\phi^{\wedge}\phi=0$ ，因此得
$\phi^{\wedge}\phi^{\wedge} \phi^{\wedge} =-\|\phi\|^{2} \phi^{\wedge}$
由于有 $||\boldsymbol{\omega}||^2=\left(\omega_{1}^{2}+\omega_{2}^{2}+\omega_{3}^{2}\right)=\theta^{2}$ 。让 $\Omega$ 代入上式，所以有 $\Omega^{3}=-\theta^{2} \Omega$ ，继续：
继续让式子左右两边左乘一个 $\phi^{\wedge}$ ：
$\phi^{\wedge}\phi^{\wedge}\phi^{\wedge} \phi^{\wedge} =-\|\phi\|^{2} \phi^{\wedge}\phi^{\wedge}$
$\phi^{\wedge}\phi^{\wedge}\phi^{\wedge}\phi^{\wedge} \phi^{\wedge} =-\|\phi\|^{2} \phi^{\wedge}\phi^{\wedge}\phi^{\wedge}=\|\phi\|^{4} \phi^{\wedge}$
如此类推可得到
$\begin{array}{c} \Omega^{4}=\Omega \Omega^{3}=-\theta^{2} \Omega^{2} \\ \Omega^{5}=\Omega^{2} \Omega^{3}=-\Omega^{2} \theta^{2} \Omega=-\theta^{2} \Omega^{3}=\theta^{4} \Omega \\ \cdots \end{array}$
所以有
$\begin{aligned} \theta^{2} &=\boldsymbol{\omega}^{T} \boldsymbol{\omega} \\ \Omega^{2 i+1} &=(-1)^{i} \theta^{2 i} \Omega \\ \Omega^{2 i+2} &=(-1)^{i} \theta^{2 i} \Omega^{2} \end{aligned}$
展开：
$\begin{aligned} \exp (\Omega) &=\sum_{n=0}^{\infty} \frac{1}{n !} \Omega^{n} \\ &=I+\left(\sum_{i=0}^{\infty} \frac{(-1)^{i} \theta^{2 i}}{(2 i+1) !}\right) \Omega+\left(\sum_{i=0}^{\infty} \frac{(-1)^{i} \theta^{2 i}}{(2 i+2) !}\right) \Omega^{2} \\ &=I+\left(1-\frac{\theta^{2}}{3 !}+\frac{\theta^{4}}{5 !}+\cdots\right) \Omega+\left(\frac{1}{2 !}-\frac{\theta^{2}}{4 !}+\frac{\theta^{4}}{6 !}+\cdots\right) \Omega^{2} \end{aligned}$
有欧拉公式:
$\begin{array}{l} \sin x=x-\frac{x^{3}}{3 !}+\frac{x^{5}}{5 !}-\frac{x^{7}}{7 !}+\cdots \\ \cos x=1-\frac{x^{2}}{2 !}+\frac{x^{4}}{4 !}-\frac{x^{6}}{6 !}+\cdots \end{array}$
所以：
$\exp (\Omega)=I+\left(\frac{\sin \theta}{\theta}\right) \Omega+\left(\frac{1-\cos \theta}{\theta^{2}}\right) \Omega^{2}$
如果我们需要更严密一点的话 $\operatorname{expso}(3) \rightarrow \mathrm{SO}(3)$ :

$\begin{array}{c} \Omega \in s o(3) \\ \theta=\sqrt{-\frac{1}{2} \operatorname{tr}\left(\Omega^{2}\right)} \\ \exp (\Omega)=\left\{\begin{array}{ll} I & \theta \simeq 0 \\ I+\left(\frac{\sin \theta}{\theta}\right) \Omega+\left(\frac{1-\cos \theta}{\theta^{2}}\right) \Omega^{2} & \theta \neq 0 \end{array}\right. \end{array}$
同样 $\mathrm{SO}(3) \rightarrow \mathrm{so}(3)$ ，也就是旋转矩阵到旋转向量。如果也更严密一点，首先就是我们限制旋转角店在 $\pi]$ 间, 毕竟可能要用 $a c o s$ 函数和保证一对一, 否则角度加上 $\pi$ 计算出来的 $\sin \cos$ 总是相等，其次就是当 $\theta$ 足够小的时候的处理：
$\begin{array}{c} R \in S O(3) \\ \theta=\arccos \left(\frac{1}{2}[\operatorname{tr}(R)-1]\right) \\ \log (R)=\left\{\begin{array}{ll} \theta\left[\begin{array}{ccc} 0 & -1 & 1 \\ 1 & 0 & -1 \\ -1 & 1 & 0 \end{array}\right] \quad \theta \simeq 0 \\ \frac{\theta}{\sin \theta}\left(R-R^{T}\right) & \theta \neq 0 \end{array}\right. \end{array}$

最后，得到罗德里格斯公式
$\exp \left(\theta \boldsymbol{a}^{\wedge}\right)=\cos \theta \boldsymbol{I}+(1-\cos \theta) \boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}+\sin \theta \boldsymbol{a}^{\wedge}\tag{4.22}$
这表明, $\mathfrak{s o}(3)$ 实际上就是由所谓的旋转向量组成的空间, 而指数映射即罗德里格斯公式。通过它们, 我们把 $\mathfrak{s o}(3)$ 中任意一个向量对应到了一个位于 $\mathrm{SO}(3)$ 中的旋转矩阵。反之, 如果定义对数映射, 也能把 $\mathrm{SO}(3)$ 中的元素对应到 $\mathfrak{s o}(3)$ 中:
$\phi=\ln (\boldsymbol{R})^{\vee}=\left(\sum_{n=0}^{\infty} \frac{(-1)^{n}}{n+1}(\boldsymbol{R}-\boldsymbol{I})^{n+1}\right)^{\vee}\tag{4.23}$
和指数映射医院，我们没必要直接用泰勒展开计算对数映射，只需要使用常规的旋转矩阵转旋转向量公式即可：
转角：
$\begin{aligned} \operatorname{tr}(\boldsymbol{R})=& \cos \theta \operatorname{tr}(\boldsymbol{I})+(1-\cos \theta) \operatorname{tr}\left(\boldsymbol{n} \boldsymbol{n}^{\mathrm{T}}\right)+\sin \theta \operatorname{tr}\left(\boldsymbol{n}^{\wedge}\right) \\ =& 3 \cos \theta+(1-\cos \theta) \\ =& 1+2 \cos \theta \\ \end{aligned}\tag{3.16}$
$\theta=\arccos \frac{\operatorname{tr}(\boldsymbol{R})-1}{2} \tag{3.17}$
转轴：
转轴 $\boldsymbol{n}$ 是矩阵 $\boldsymbol{R}$ 特征值1对应的特征向量。

如果我们把旋转角度固定在 $±\pi$ 之间，那么李群和李代数元素是一一对应的。

4.2.2 SE(3)上的指数映射

$\mathfrak{s e}(3)$ 上的指数映射形式：
$\begin{aligned} \exp \left(\boldsymbol{\xi}^{\wedge}\right) &=\left[\begin{array}{cc} \sum_{n=0}^{\infty} \frac{1}{n !}\left(\phi^{\wedge}\right)^{n} & \sum_{n=0}^{\infty} \frac{1}{(n+1) !}\left(\phi^{\wedge}\right)^{n} \rho \\ 0^{\mathrm{T}} & 1 \end{array}\right] \\ & \triangleq\left[\begin{array}{cc} \boldsymbol{R} & \boldsymbol{J} \boldsymbol{\rho} \\ \mathbf{0}^{\mathrm{T}} & 1 \end{array}\right]=\boldsymbol{T} \end{aligned}\tag{4.25}$
只要有一点耐心, 可以照着 $\mathfrak{s o}(3)$ 上的做法推导, 把 $\exp$ 进行泰勒展开推导此式。令 $\phi=\theta \boldsymbol{a}$ , 其中 $\boldsymbol{a}$ 为单位向量, 则
$\begin{aligned} \sum_{n=0}^{\infty} \frac{1}{(n+1) !}\left(\boldsymbol{\phi}^{\wedge}\right)^{n} &=\boldsymbol{I}+\frac{1}{2 !} \theta \boldsymbol{a}^{\wedge}+\frac{1}{3 !} \theta^{2}\left(\boldsymbol{a}^{\wedge}\right)^{2}+\frac{1}{4 !} \theta^{3}\left(\boldsymbol{a}^{\wedge}\right)^{3}+\frac{1}{5 !} \theta^{4}\left(\boldsymbol{a}^{\wedge}\right)^{4} \cdots \\ &=\frac{1}{\theta}\left(\frac{1}{2 !} \theta^{2}-\frac{1}{4 !} \theta^{4}+\cdots\right)\left(\boldsymbol{a}^{\wedge}\right)+\frac{1}{\theta}\left(\frac{1}{3 !} \theta^{3}-\frac{1}{5} \theta^{5}+\cdots\right)\left(\boldsymbol{a}^{\wedge}\right)^{2}+\boldsymbol{I} \\ &=\frac{1}{\theta}(1-\cos \theta)\left(\boldsymbol{a}^{\wedge}\right)+\frac{\theta-\sin \theta}{\theta}\left(\boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}-\boldsymbol{I}\right)+\boldsymbol{I} \\ &=\frac{\sin \theta}{\theta} \boldsymbol{I}+\left(1-\frac{\sin \theta}{\theta}\right) \boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}+\frac{1-\cos \theta}{\theta} \boldsymbol{a}^{\wedge} \\ &\stackrel{\text { def }}{=} \boldsymbol{J} \end{aligned}\tag{4.26}$

李群和李代数的定义与相互转换关系总结

在这里插入图片描述

4.3 李代数求导与扰动模型

4.3.1 BCH公式与近似形式

高等数学告诉我们，如果有标量 $A$ 和 $B$ ，有下式：
$\ln\left(\exp\left(A\right)\exp\left(B\right)\right)=A+B$
但是，该式在矩阵时并不成立。两个李代数指数映射乘积的完整形式，由Baker-Campbell-Hausdorff公式（BCH公式）给出：
$\ln (\exp (\boldsymbol{A}) \exp (\boldsymbol{B}))=\boldsymbol{A}+\boldsymbol{B}+\frac{1}{2}[\boldsymbol{A}, \boldsymbol{B}]+\frac{1}{12}[\boldsymbol{A},[\boldsymbol{A}, \boldsymbol{B}]]-\frac{1}{12}[\boldsymbol{B},[\boldsymbol{A}, \boldsymbol{B}]]+\cdots\tag{4.29}$
其中 $[\ \ ]$ 为李括号。特别地，考虑 $\mathfrak{s o}(3)$ 上地李代数 $\ln\left(\exp\left(\phi_1^{\wedge}\right)\exp\left(\phi_2^{\wedge}\right)\right)^{\vee}$ ，当 $\phi_1^{\wedge}$ 或 $\phi_2^{\wedge}$ 为小量时，小量二次以上的项都可以被忽略。此时，BCH拥有线性近似表达：
$\ln \left(\exp \left(\phi_{1}^{\wedge}\right) \exp \left(\phi_{2}^{\wedge}\right)\right)^{\vee} \approx\left\{\begin{array}{ll} J_{l}\left(\phi_{2}\right)^{-1} \phi_{1}+\phi_{2} & \text { 当 } \phi_{1} \text { 为小量, } \\ J_{r}\left(\phi_{1}\right)^{-1} \phi_{2}+\phi_{1} & \text { 当 } \phi_{2} \text { 为小量. } \end{array}\right.\tag{4.30}$
于是，李代数在BCH近似下，分成了左乘近似和右乘近似两种。其中，左乘BCH近似雅可比 $J_l$ 为：
$\boldsymbol{J}_{l}(\theta)=\boldsymbol{J}=\frac{\sin \theta}{\theta} \boldsymbol{I}+\left(1-\frac{\sin \theta}{\theta}\right) \boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}+\frac{1-\cos \theta}{\theta} \boldsymbol{a}^{\wedge}\tag{4.31}$
它的逆为
$\boldsymbol{J}_{l}(\theta)^{-1}=\frac{\theta}{2} \cot \frac{\theta}{2} \boldsymbol{I}+\left(1-\frac{\theta}{2} \cot \frac{\theta}{2}\right) \boldsymbol{a} \boldsymbol{a}^{\mathrm{T}}-\frac{\theta}{2} \boldsymbol{a}^{\wedge}\tag{4.32}$
其中 $\cot()$ 为余切函数。

而右乘雅可比仅需要对自变量取负号即可:
$J_{r}(\phi)=J_{l}(-\phi)\tag{4.33}$
BCH近似的意义：假定对某个旋转 $\boldsymbol{R}$ ，对应的李代数为 $\boldsymbol{\phi}$ 。我们给它左乘一个微小旋转，记作 $\Delta \boldsymbol{R}$ ，对应的李代数为 $\Delta \boldsymbol{\phi}$ 。那么，在李群上，得到的结果就是 $\Delta \boldsymbol{R}\cdot\boldsymbol{R}$ ，而在李代数上，根据BCH近似，为 $\phi+J_{l}^{-1}(\phi) \Delta \phi$ 。合并起来，可以简单地写成：
$\exp \left(\Delta \phi^{\wedge}\right) \exp \left(\phi^{\wedge}\right)=\exp \left(\left(\phi+J_{l}^{-1}(\phi) \Delta \phi\right)^{\wedge}\right)\tag{4.34}$
反之, 如果我们在李代数上进行加法, 让一个 $\phi$ 加上 $\Delta \phi$ , 那么可以近似为李群上带左右雅可比的乘法（尤其需要注意左乘雅可比和右乘雅可比是不同的）:
$\exp \left((\phi+\Delta \phi)^{\wedge}\right)=\exp \left(\left(\boldsymbol{J}_{l} \Delta \phi\right)^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right)=\exp \left(\boldsymbol{\phi}^{\wedge}\right) \exp \left(\left(\boldsymbol{J}_{r} \Delta \boldsymbol{\phi}\right)^{\wedge}\right)\tag{4.35}$
这就为之后李代数上做微积分提供了理论基础。同样地, 对于 $\mathrm{SE}(3)$ , 也有类似的BCH近似:
$\begin{array}{l} \exp \left(\Delta \boldsymbol{\xi}^{\wedge}\right) \exp \left(\boldsymbol{\xi}^{\wedge}\right) \approx \exp \left(\left(\mathcal{J}_{l}^{-1} \Delta \boldsymbol{\xi}+\boldsymbol{\xi}\right)^{\wedge}\right) \\ \exp \left(\boldsymbol{\xi}^{\wedge}\right) \exp \left(\Delta \boldsymbol{\xi}^{\wedge}\right) \approx \exp \left(\left(\mathcal{J}_{r}^{-1} \Delta \boldsymbol{\xi}+\boldsymbol{\xi}\right)^{\wedge}\right) \end{array}\tag{4.36}$
这里的 $\mathcal{J}_{l}$ 形式比较复杂，它是一个6X6矩阵。

4.3.2 SO(3)上的李代数求导

假设某个时刻机器人的位姿为 $\boldsymbol{T}$ 。它观察到了一个世界坐标位于 $\boldsymbol{p}$ 的点，产生了一个观测数据 $\boldsymbol{z}$ 。那么，由坐标变换关系知：
$\boldsymbol{z}=\boldsymbol{T} \boldsymbol{p}+\boldsymbol{w}\tag{4.38}$
其中 $\boldsymbol{w}$ 为随机噪声。由于它的存在, $\boldsymbol{z}$ 往往不可能精确地满足 $\boldsymbol{z}=\boldsymbol{T} \boldsymbol{p}$ 的关系。所以, 我们通常会计算理想的观测与实际数据的误差:
$\boldsymbol{e}=\boldsymbol{z}-\boldsymbol{T} \boldsymbol{p}\tag{4.39}$
假设一共有 $N$ 个这样的路标点和观测, 于是就有 $N$ 个上式。那么, 对机器人进行位姿估计, 相当于寻找一个最优的 $\boldsymbol{T}$ , 使得整体误差最小化:
$\min _{\boldsymbol{T}} J(\boldsymbol{T})=\sum_{i=1}^{N}\left\|\boldsymbol{z}_{i}-\boldsymbol{T} \boldsymbol{p}_{i}\right\|_{2}^{2}\tag{4.40}$
SO(3)，SE(3) 上并没有良好定义的加法，它们只是群。如果我们把 $\boldsymbol{T}$ 当成一个普通矩阵来处理优化，那就必须对优化问题添加约束（一旦有约束就变得很复杂了）。而从李代数角度来说，由于李代数由向量组成，具有良好的加法运算。因此，使用李代数解决求导问题的思路分为两种：

用李代数表示姿态，然后对根据李代数加法来对李代数求导。
对李群左乘或右乘微小扰动，然后对该扰动求导，称为左扰动和右扰动模型。

4.3.3 李代数求导

首先，考虑SO(3)上的情况。假设我们对一个空间点 $\boldsymbol{p}$ 进行了旋转，得到了 $\boldsymbol{Rp}$ 。现在，要计算旋转之后点的坐标相对于旋转的导数，我们非正式地记为：
$\frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{R}}$
由于 $\mathrm{SO}(3)$ 没有加法, 所以该导数无法按照导数的定义进行计算。设 $\boldsymbol{R}$ 对应的李代数为 $\phi$ , 我们转而计算。
$\frac{\partial\left(\exp \left(\phi^{\wedge}\right) \boldsymbol{p}\right)}{\partial \phi}$
按照导数的定义, 有
$\begin{aligned} \frac{\partial\left(\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}\right)}{\partial \boldsymbol{\phi}} &=\lim _{\delta \boldsymbol{\phi} \rightarrow 0} \frac{\exp \left((\boldsymbol{\phi}+\delta \boldsymbol{\phi})^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\phi}} \\ &=\lim _{\delta \boldsymbol{\phi} \rightarrow 0} \frac{\exp \left(\left(\boldsymbol{J}_{l} \delta \boldsymbol{\phi}\right)^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\phi}} \\ &=\lim _{\delta \phi \rightarrow 0} \frac{\left(\boldsymbol{I}+\left(\boldsymbol{J}_{l} \delta \boldsymbol{\phi}\right)^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\phi}} \\ &=\lim _{\delta \phi \rightarrow 0} \frac{\left(\boldsymbol{J}_{l} \delta \boldsymbol{\phi}\right)^{\wedge} \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\phi}} \\ &=\lim _{\delta \boldsymbol{\phi} \rightarrow 0} \frac{-\left(\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}\right)^{\wedge} \boldsymbol{J}_{l} \delta \boldsymbol{\phi}}{\delta \boldsymbol{\phi}}=-(\boldsymbol{R} \boldsymbol{p})^{\wedge} \boldsymbol{J}_{l} \end{aligned}$
第二行地近似为BCH线性近似，第三行为泰勒展开社区高阶项后地近似（ $\exp()$ 括号内的矩阵范数很小时才可以这样近似），第四行至第五行将反对称符号看作叉积，交换之后变号。于是，我们推导出了旋转后的点相对于李代数的导数：
$\frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{R}}=-(\boldsymbol{R} \boldsymbol{p})^{\wedge} \boldsymbol{J}_{l}\tag{4.41}$
不过，由于这里仍然含有形式比较复杂的 $\boldsymbol{J}_{l}$ ，我们不太希望计算它。而下面要讲的扰动模型则提供了更简单的导数计算方式。

4.3.4 扰动模型（左乘）

另一种求导方式是对 $\boldsymbol{R}$ 进行一次扰动 $\Delta \boldsymbol{R}$ , 看结果相对于扰动的变化率。这个扰动可以乘在左边也可以乘在右边, 最后结果会有一点儿微小的差异, 我们以左扰动为例。设左扰动 $\Delta \boldsymbol{R}$ 对应的李代数为 $\varphi_{\circ}$ 然后, 对 $\varphi$ 求导, 即
$\frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{\varphi}}=\lim _{\varphi \rightarrow 0} \frac{\exp \left(\boldsymbol{\varphi}^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}}\tag{4.42}$
该式的求导比上面更简单:
$\begin{aligned} \frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{\varphi}} &=\lim _{\boldsymbol{\varphi} \rightarrow \mathbf{0}} \frac{\exp \left(\boldsymbol{\varphi}^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}} \\ &=\lim _{\boldsymbol{\varphi} \rightarrow 0} \frac{\left(\boldsymbol{I}+\boldsymbol{\varphi}^{\wedge}\right) \exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}} \\ &=\lim _{\boldsymbol{\varphi} \rightarrow 0} \frac{\boldsymbol{\varphi}^{\wedge}\boldsymbol{R} p}{\boldsymbol{\varphi}}=\lim _{\boldsymbol{\varphi} \rightarrow \mathbf{0}} \frac{-(\boldsymbol{R} \boldsymbol{p})^{\wedge} \boldsymbol{\varphi}}{\boldsymbol{\varphi}}=-(\boldsymbol{R} \boldsymbol{p})^{\wedge} \end{aligned}$
可见, 相比于直接对李代数求导, 省去了一个雅可比 $\boldsymbol{J}_{l}$ 的计算。这使得扰动模型更为实用。请读者务必理解这里的求导运算, 这在位姿估计中具有重要的意义。

4.3.4扩展1：扰动模型（右乘）

右扰动模型定义：
$\frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{\varphi}}=\lim _{\varphi \rightarrow 0} \frac{\exp \left(\boldsymbol{\phi}^{\wedge} \right) \exp \left(\boldsymbol{\varphi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}}\tag{4.42}$
进一步推算求导
$\begin{aligned} \frac{\partial(\boldsymbol{R} \boldsymbol{p})}{\partial \boldsymbol{\varphi}} &=\lim _{\boldsymbol{\varphi} \rightarrow \mathbf{0}} \frac{\exp \left(\boldsymbol{\phi}^{\wedge} \right) \exp \left(\boldsymbol{\varphi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}} \\ &=\lim _{\boldsymbol{\varphi} \rightarrow 0} \frac{\exp \left(\boldsymbol{\phi}^{\wedge}\right) \left(\boldsymbol{I}+\boldsymbol{\varphi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\phi}^{\wedge}\right) \boldsymbol{p}}{\boldsymbol{\varphi}} \\ &=\lim _{\boldsymbol{\varphi} \rightarrow 0} \frac{\boldsymbol{R} \boldsymbol{\varphi}^{\wedge}p}{\boldsymbol{\varphi}}=\lim _{\boldsymbol{\varphi} \rightarrow \mathbf{0}} \frac{-\boldsymbol{R} \boldsymbol{p}^{\wedge} \boldsymbol{\varphi}}{\boldsymbol{\varphi}}=-\boldsymbol{R} \boldsymbol{p}^{\wedge} \end{aligned}$

4.3.4扩展2：伴随

在SO(3) 和SE(3) 上，有⼀个东西称为伴随（Adjoint）。对于SO(3)，有：
$\boldsymbol{R} \exp \left(\boldsymbol{p}^{\wedge}\right) \boldsymbol{R}^{\mathrm{T}}=\exp \left((\boldsymbol{R} \boldsymbol{p})^{\wedge}\right)$
此时称 $\operatorname{Ad}(\boldsymbol{R})=\boldsymbol{R}$ 。

提示: 首先你需要证明 $\forall a \in \mathbb{R}^{3}, \boldsymbol{R a}^{\wedge} \boldsymbol{R}^{\mathrm{T}}=(\boldsymbol{R} \boldsymbol{a})^{\wedge}$ , 页面Derivation of Adjoint for SO(3)提示了一种简洁的途径。如下：

设有任意向量 $\boldsymbol{v}$ ，与式子右边内积：
$\begin{aligned} (\boldsymbol{R} \boldsymbol{a})^{\wedge}\boldsymbol{v} &= (\boldsymbol{R} \boldsymbol{a})\times \boldsymbol{v}\\ &=(\boldsymbol{R} \boldsymbol{a})\times (\boldsymbol{R}\boldsymbol{R}^\boldsymbol{T}\boldsymbol{v}) \\ &=\boldsymbol{R}\left(\boldsymbol{a}\times\left(\boldsymbol{R}^\boldsymbol{T}\boldsymbol{v}\right)\right)\\ &=\boldsymbol{R}\left(\boldsymbol{a}^{\wedge}\boldsymbol{R}^\boldsymbol{T}\boldsymbol{v}\right)\\ &=\boldsymbol{R}\boldsymbol{a}^{\wedge}\boldsymbol{R}^\boldsymbol{T}\boldsymbol{v} \end{aligned}$
证毕， $\forall a \in \mathbb{R}^{3}, \boldsymbol{R a}^{\wedge} \boldsymbol{R}^{\mathrm{T}}=(\boldsymbol{R} \boldsymbol{a})^{\wedge}$ 。

对于 $\mathrm{SE}(3)$ , 有:
$\boldsymbol{T} \exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{T}^{-1}=\exp \left((\operatorname{Ad}(\boldsymbol{T}) \boldsymbol{\xi})^{\wedge}\right)$
其中 $\operatorname{Ad}(\boldsymbol{T})$ 定义为:
$\operatorname{Ad}(\boldsymbol{T})=\left[\begin{array}{cc} \boldsymbol{R} & \boldsymbol{t}^{\wedge} \boldsymbol{R} \\ \mathbf{0} & \boldsymbol{R} \end{array}\right]$
这个性质将在后文的 Pose Graph 优化中用到。但是 $\mathrm{SE}(3)$ 的证明较为复杂。

4.3.4扩展3：扰动求导的例子

参考李代数扰动模型求导总结
例子1
$\frac{\partial{R_1R_2}}{\partial{R_1}}=I$
求 $R_1R_2$ 对 $R_1$ 的左扰动导数：
$\begin{aligned} \frac{\partial{R_1R_2}}{\partial{R_1}}&=\frac{\partial{\log(\exp(\delta)R_1R_2(R_1R_2)^{-1})}}{\partial{\delta}}|_{\delta=0}\\ &=\frac{\partial{\log(\exp(\delta)R_1R_2R_2^{-1}R_1^{-1})}}{\partial{\delta}}|_{\delta=0}\\ &=\frac{\partial{\log(\exp(\delta))}}{\partial{\delta}}|_{\delta=0}\\ &=I \end{aligned}$

例子2
$\frac{\partial{R_1R_2}}{\partial{R_2}}=R_1$
求 $R_1R_2$ 对 $R_2$ 的左扰动导数：
$\begin{aligned} \frac{\partial{R_1R_2}}{\partial{R_2}}&=\frac{\partial{\log(R_1\exp(\delta)R_2(R_1R_2)^{-1})}}{\partial{\delta}}|_{\delta=0}\\ &=\frac{\partial{\log(R_1\exp(\delta)R_2R_2^{-1}R_1^{-1})}}{\partial{\delta}}|_{\delta=0}\\ &=\frac{\partial{\log(R_1\exp(\delta)R_1^{-1})}}{\partial{\delta}}|_{\delta=0}\\ &=\frac{\partial{\log(\exp(R_1\delta))}}{\partial{\delta}}|_{\delta=0}\\ &=R_1 \end{aligned}$

例子3
$\frac{\partial{R^{-1}}}{\partial{R}}=-R^{-1}=-R^\intercal$
求 $R^{-1}$ 对 $R$ 的左扰动导数：
$\begin{aligned} \frac{\partial{R^{-1}}}{\partial{R}}&=\frac{\partial{\log((\exp(\delta)R)^{-1}R)}}{\partial\delta}|_{\delta=0}\\ &=\frac{\partial{\log((R^{-1}\exp(\delta)R)^{-1})}}{\partial\delta}|_{\delta=0}\\ &=\frac{\partial{\log(\exp(R^{-1}\delta)^{-1})}}{\partial\delta}|_{\delta=0}\\ &=\frac{\partial{\log(\exp(-R^{-1}\delta))}}{\partial\delta}|_{\delta=0}\\ &=-R^{-1}=-R^{\intercal} \end{aligned}$

$\exp(\phi)^{-1}=\exp(-\phi)$
证明：
已知：
$\begin{aligned} \exp(\phi)=\exp(\theta\cdot a)=\cos(\theta)\cdot I+(1-\cos(\theta))a\cdot a^\intercal+\sin(\theta)a^\wedge \end{aligned}$
和：
$(a^\wedge)^\intercal=-a^\wedge$
则：
$\begin{aligned} \exp(\phi)^{-1}=\exp(\theta\cdot a)^\intercal&=\cos(\theta)\cdot I^\intercal+(1-\cos(\theta))(a\cdot a^\intercal)^\intercal+\sin(\theta)(a^\wedge)^\intercal \\ &=\cos(\theta)\cdot I+(1-\cos(\theta))a\cdot a^\intercal-\sin(\theta)a^\wedge \\ \\ \exp(-\phi)=\exp(-\theta\cdot a)&=\cos(-\theta)\cdot I+(1-\cos(-\theta))a\cdot a^\intercal+\sin(-\theta)a^\wedge \\ &=\cos(\theta)\cdot I+(1-\cos(\theta))a\cdot a^\intercal-\sin(\theta)a^\wedge \end{aligned}$
因此：
$\exp(\phi)^{-1}=\exp(-\phi)$

4.3.5 SE(3)上的扰动模型

最后, 我们给出 $\mathrm{SE}(3)$ 上的扰动模型, 而直接李代数上的求导就不再介绍了。假设某空间点 $p$ 经过一次变换 $\boldsymbol{T}$ (对应李代数为 $\boldsymbol{\xi}$ ) , 得到 $\boldsymbol{T} \boldsymbol{p}^{\mathbb{}}$ 。现在, 给 $\boldsymbol{T}$ 左乘一个扰动 $\Delta \boldsymbol{T}=\exp \left(\delta \boldsymbol{\xi}^{\wedge}\right)$ , 我们设扰动项的李代数为 $\delta \boldsymbol{\xi}=[\delta \boldsymbol{\rho}, \delta \phi]^{\mathrm{T}}$ , 那么：
$\frac{\partial(\boldsymbol{T} \boldsymbol{p})}{\partial \delta \boldsymbol{\xi}}=\lim _{\delta \xi \rightarrow 0} \frac{\exp \left(\delta \boldsymbol{\xi}^{\wedge}\right) \exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\xi}}$
$\begin{array}{l} =\lim _{\delta \xi \rightarrow 0} \frac{\left(\boldsymbol{I}+\delta \boldsymbol{\xi}^{\wedge}\right) \exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{p}-\exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\xi}} \\ =\lim _{\delta \boldsymbol{\xi} \rightarrow 0} \frac{\delta \boldsymbol{\xi}^{\wedge} \exp \left(\boldsymbol{\xi}^{\wedge}\right) \boldsymbol{p}}{\delta \boldsymbol{\xi}} \\ =\lim _{\delta \boldsymbol{\xi} \rightarrow \mathbf{0}} \frac{\left[\begin{array}{cc} \delta \boldsymbol{\phi}^{\wedge} & \delta \boldsymbol{\rho} \\ \mathbf{0}^{\mathrm{T}} & 0 \end{array}\right]\left[\begin{array}{c} \boldsymbol{R} \boldsymbol{p}+\boldsymbol{t} \\ 1 \end{array}\right]}{\delta \boldsymbol{\xi}} \\ =\lim _{\delta \boldsymbol{\xi} \rightarrow \mathbf{0}} \frac{\left[\begin{array}{c} \delta \boldsymbol{\phi}^{\wedge}(\boldsymbol{R} \boldsymbol{p}+\boldsymbol{t})+\delta \boldsymbol{\rho} \\ \mathbf{0}^{\mathrm{T}} \end{array}\right]}{[\delta \boldsymbol{\rho}, \delta \boldsymbol{\phi}]^{\mathrm{T}}}=\left[\begin{array}{cc} \boldsymbol{I} & -(\boldsymbol{R} \boldsymbol{p}+\boldsymbol{t})^{\wedge} \\ \mathbf{0}^{\mathrm{T}} & \mathbf{0}^{\mathrm{T}} \end{array}\right] \stackrel{\operatorname{def}}{=}(\boldsymbol{T} \boldsymbol{p})^{\odot} . \end{array}$
我们把最后的结果定义成一个算符 $^\odot$ , 它把一个齐次坐标的空间点变换成一个 $\times 6$ 的矩阵。此式稍微需要解释的是矩阵求导方面的顺序, 假设 $\boldsymbol{a}, \boldsymbol{b}, \boldsymbol{x}, \boldsymbol{y}$ 都是列向量, 那么在我们的符号写法下, 有如下的规则:
$\frac{\mathrm{d}\left[\begin{array}{l} a \\ b \end{array}\right]}{\mathrm{d}\left[\begin{array}{l} \boldsymbol{x} \\ \boldsymbol{y} \end{array}\right]}=\left(\begin{array}{c} \frac{\mathrm{d}[\boldsymbol{a}, \boldsymbol{b}]^{\mathrm{T}}} {\mathrm{d}\left[\begin{array}{l} \boldsymbol{x} \\ \boldsymbol{y} \end{array}\right]} \end{array}\right)^\mathrm{T}=\left[\begin{array}{cc} \frac{\mathrm{d} \boldsymbol{a}}{\mathrm{d} \boldsymbol{x}} & \frac{\mathrm{d} \boldsymbol{b}}{\mathrm{d} \boldsymbol{x}} \\ \frac{\mathrm{d} \boldsymbol{a}}{\mathrm{d} \boldsymbol{y}} & \frac{\mathrm{d} \boldsymbol{b}}{\mathrm{d} \boldsymbol{y}} \end{array}\right]^{\mathrm{T}}=\left[\begin{array}{cc} \frac{\mathrm{d} \boldsymbol{a}}{\mathrm{d} \boldsymbol{x}} & \frac{\mathrm{d} \boldsymbol{a}}{\mathrm{d} \boldsymbol{y}} \\ \frac{\mathrm{d} \boldsymbol{b}}{\mathrm{d} \boldsymbol{x}} & \frac{\mathrm{d} \boldsymbol{b}}{\mathrm{d} \boldsymbol{y}} \end{array}\right]$

4.4 实践：Sopuhs

待续…

4.5 相似变换群与李代数

最后, 我们要提一下在单目视觉中使用的相似变换群 $\operatorname{Sim}(3)$ , 以及对应的李代数 $\operatorname{sim}(3)$ 。如果在单目 SLAM 中使用 $\mathrm{SE}(3)$ 表示位姿, 那么由于尺度不确定性与尺度漂移，整个SLAM过程中的尺度会发生变化, 这在 $\mathrm{SE}(3)$ 中末能体现出来。因此, 在单目情况下我们一般会显式地把尺度因子表达出来。用数学语言来说, 对于位于空间的点 $\boldsymbol{p}$ , 在相机坐标系下要经过一个相似变换, 而非欧氏变换:
$\boldsymbol{p}^{\prime}=\left[\begin{array}{cc} s \boldsymbol{R} & t \\ 0^{\mathrm{T}} & 1 \end{array}\right] \boldsymbol{p}=s \boldsymbol{R} \boldsymbol{p}+\boldsymbol{t}$
在相似变换中, 我们把尺度 $s$ 表达出来了。它同时作用在 $\boldsymbol{p}$ 的 3 个坐标之上, 对 $\boldsymbol{p}$ 进行了一次缩放。与 $\mathrm{SO}(3)$ 、 $\mathrm{SE}(3)$ 相似, 相似变换也对矩阵乘法构成群, 称为相似变换群 $\operatorname{Sim}(3)$ :
$\operatorname{Sim}(3)=\left\{S=\left[\begin{array}{cc} s \boldsymbol{R} & t \\ \mathbf{0}^{\mathrm{T}} & 1 \end{array}\right] \in \mathbb{R}^{4 \times 4}\right\}$
同样地, $\operatorname{Sim}(3)$ 也有对应的李代数、指数映射、对数映射等。李代数 $\operatorname{sim}(3)$ 元素是一个 7 维向量 $\zeta$ 。它的前6维与 $\mathfrak{s e}(3)$ 相同, 最后多了一项 $\sigma_{\text {。 }}$
$\operatorname{sim}(3)=\left\{\boldsymbol{\zeta} \mid \boldsymbol{\zeta}=\left[\begin{array}{l} \rho \\ \phi \\ \sigma \end{array}\right] \in \mathbb{R}^{7}, \boldsymbol{\zeta}^{\wedge}=\left[\begin{array}{cc} \sigma I+\phi^{\wedge} & \rho \\ \mathbf{0}^{\mathrm{T}} & 0 \end{array}\right] \in \mathbb{R}^{4 \times 4}\right\}$
它比 $\mathfrak{s e}(3)$ 多了一项 $\sigma_{\circ}$ 关联 $\operatorname{Sim}(3)$ 和 $\operatorname{sim}(3)$ 的仍是指数映射和对数映射。指数映射为
$\exp \left(\boldsymbol{\zeta}^{\wedge}\right)=\left[\begin{array}{cc} \mathrm{e}^{\sigma} \exp \left(\boldsymbol{\phi}^{\wedge}\right) & \boldsymbol{J}_{s} \rho \\ \boldsymbol{0}^{\mathrm{T}} & 1 \end{array}\right]$
其中, $\boldsymbol{J}_{s}$ 的形式为
$\begin{aligned} J_{s}=& \frac{\mathrm{e}^{\sigma}-1}{\sigma} \boldsymbol{I}+\frac{\sigma \mathrm{e}^{\sigma} \sin \theta+\left(1-\mathrm{e}^{\sigma} \cos \theta\right) \theta}{\sigma^{2}+\theta^{2}} \boldsymbol{a}^{\wedge} \\ &+\left(\frac{\mathrm{e}^{\sigma}-1}{\sigma}-\frac{\left(\mathrm{e}^{\sigma} \cos \theta-1\right) \sigma+\left(\mathrm{e}^{\sigma} \sin \theta\right) \theta}{\sigma^{2}+\theta^{2}}\right) \boldsymbol{a}^{\wedge} \boldsymbol{a}^{\wedge} \end{aligned}$
通过指数映射, 我们能够找到李代数与李群的关系。对于李代数 $\boldsymbol{\zeta}$ , 它与李群的对应关系为
$s=\mathrm{e}^{\sigma}, \boldsymbol{R}=\exp \left(\boldsymbol{\phi}^{\wedge}\right), \boldsymbol{t}=\boldsymbol{J}_{s} \boldsymbol{\rho}$
旋转部分和 $\mathrm{SO}(3)$ 是一致的。平移部分，在 $\mathfrak{s e}(3)$ 中需要乘一个雅可比 $\mathcal{J}$ , 而相似变换的雅可比更复杂。对于尺度因子, 可以看到李群中的 $s$ 即为李代数中 $\sigma$ 的指数函数。

$\operatorname{Sim}(3)$ 的 $\mathrm{BCH}$ 近似与 $\mathrm{SE}(3)$ 是类似的。我们可以讨论一个点 $\boldsymbol{p}$ 经过相似变换 $\boldsymbol{S} \boldsymbol{p}$ 后, 相对于 $S$ 的导数。同样地，存在微分模型和扰动模型两种方式, 而扰动模型较为简单。我们省略推导过程，直接给出扰动模型的结果。设给予 $\boldsymbol{p}$ 左侧一个小扰动 $\exp \left(\boldsymbol{\zeta}^{\wedge}\right)$ , 并求 $\boldsymbol{S p}$ 对于扰动的导数。因为 $S p$ 是 4 维的齐次坐标, $\zeta$ 是 7 维向量, 所以该导数应该是 $\times 7$ 的雅可比。方便起见, 记 $\boldsymbol{p}$ 的前 3 维组成向量为 $\boldsymbol{q}$ , 那么:
$\frac{\partial \boldsymbol{S p}}{\partial \boldsymbol{\zeta}}=\left[\begin{array}{ccc} \boldsymbol{I} & -\boldsymbol{q}^{\wedge} & \boldsymbol{q} \\ \mathbf{0}^{\mathrm{T}} & \mathbf{0}^{\mathrm{T}} & 0 \end{array}\right]$

家家的快乐空间

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《视觉SLAM十四讲》读书笔记（二）

李群与李代数引入李群与李代数的原因：旋转矩阵自身是带有约束的（正交且行列式为1）.它们作为优化变量时，会引入额外的约束，使优化变得困难。通过李群——李代数间的转换关系，我们希望把位姿估计变成无约束的优化问题，简化求解方式。4.1 李群与李代数基础三维旋转矩阵构成了特殊正交群SO(3)变换矩阵构成了特殊欧式群SE(3)SO(3)={R∈R3×3∣RRT=I,det⁡(R)=1}SE(3)={T=[Rt0T1]∈R4×4∣R∈SO(3),t∈R3}\begin{array}{l}\mathrm{S
复制链接

扫一扫