SLAM基础——舒尔补介绍

最新推荐文章于 2024-05-06 16:38:48 发布

雨luo凡城

最新推荐文章于 2024-05-06 16:38:48 发布

阅读量5.6k

点赞数 18

分类专栏： SLAM从小白到大黑

本文链接：https://blog.csdn.net/jdy_lyy/article/details/119258928

版权

SLAM从小白到大黑专栏收录该内容

20 篇文章 73 订阅

订阅专栏

舒尔补是一种矩阵分解方法，用于将矩阵M转换为对角形式，简化计算。它在快速求解矩阵逆、信息矩阵处理和多元高斯分布分析中有重要应用。通过舒尔补，可以将高斯分布分解为边际概率和条件概率，同时提供求解协方差矩阵和信息矩阵的手段。在多元高斯分布中，舒尔补帮助分解出边际概率和条件概率的协方差及信息矩阵，进而方便地进行概率计算。

摘要由CSDN通过智能技术生成

1📖 舒尔补介绍

1-1🔖 舒尔补定义

给定任意的矩阵块 $\mathbf{M}$ ，如下所示:
$\mathbf{M}=\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]$

如果，矩阵块 $\mathrm{D}$ 是可逆的，则 $\mathrm{A}-\mathrm{BD}^{-1} \mathrm{C}$ 称之为 $\mathrm{D}$ 关于 $\mathrm{M}$ 的舒尔补。
如果，矩阵块 $\mathbf{A}$ 是可逆的，则 $\mathrm{D}-\mathrm{CA}^{-1} \mathrm{~B}$ 称之为 $\mathrm{A}$ 关于 $\mathrm{M}$ 的舒尔补。

1-2🔖 舒尔补的定理推导

将 $\mathrm{M}$ 矩阵分别变成上三角或者下三角形：
$\begin{array}{l} {\left[\begin{array}{cc} \mathbf{I} & \mathbf{0} \\ \mathbf{- C A}^{-1} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]=\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{0} & \Delta_{\mathbf{A}} \end{array}\right]} \\ {\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & -\mathbf{A}^{-1} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]=\left[\begin{array}{cc} \mathbf{A} & 0 \\ \mathbf{C} & \Delta_{\mathbf{A}} \end{array}\right]} \end{array}$
其中： $\Delta_{\mathrm{A}}=\mathrm{D}-\mathbf{C A}^{-1} \mathbf{B}$ 。联合起来，将 $\mathbf{M}$ 变形成对角形:
$\left[\begin{array}{cc} \mathbf{I} & \mathbf{0} \\ -\mathbf{C A}^{-1} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & -\mathbf{A}^{-\mathbf{1}} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]=\left[\begin{array}{cc} \mathbf{A} & \mathbf{0} \\ \mathbf{0} & \Delta_{\mathbf{A}} \end{array}\right]$
反过来，我们又能从对角形恢复成矩阵 $\mathbf{M}$ :
$\left[\begin{array}{cc} \mathbf{I} & \mathbf{0} \\ \mathbf{C A}^{-1} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{A} & \mathbf{0} \\ \mathbf{0} & \Delta_{\mathbf{A}} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & \mathbf{A}^{-\mathbf{1}} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]=\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]$

1-3 🔖 用途：快速求矩阵的逆

矩阵 $\mathrm{M}$ 可写为：
$\mathrm{M} = \left[\begin{array}{ll} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]=\left[\begin{array}{cc} \mathbf{I} & \mathbf{0} \\ \mathbf{C A}^{-1} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{A} & \mathbf{0} \\ \mathbf{0} & \Delta_{\mathbf{A}} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & \mathbf{A}^{-\mathbf{1}} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]$
所以
$\mathrm{M}^{-1}= \left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{C} & \mathbf{D} \end{array}\right]^{-1}=\left[\begin{array}{cc} \mathbf{I} & -\mathbf{A}^{-1} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{A}^{-1} & \mathbf{0} \\ \mathbf{0} & \Delta_{\mathbf{A}}^{-1} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & \mathbf{0} \\ -\mathbf{C A}^{-1} & \mathbf{I} \end{array}\right]$

依据提示：
$\left[\begin{array}{cc} \mathbf{I} & -\mathbf{A}^{-\mathbf{1}} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]\left[\begin{array}{cc} \mathbf{I} & \mathbf{A}^{-1} \mathbf{B} \\ \mathbf{0} & \mathbf{I} \end{array}\right]=\mathbf{I}$

最终结果：
$\mathrm{M}^{-1}=\left[\begin{array}{cc} A^{-1}+A^{-1} B \Delta_{\mathrm{A}}^{-1} C A^{-1} & -A^{-1} B \Delta_{\mathrm{A}}^{-1} \\ -\Delta_{\mathrm{A}}^{-1} C A^{-1} & \Delta_{\mathrm{A}}^{-1} \end{array}\right]$

1-4🔖用途：舒尔补在信息矩阵求解中的使用

假设我们已知信息矩阵：

另外，根据舒尔补公式可知，协方差矩阵各块和信息矩阵之间的关系有：

协方差矩阵：
$\mathbf{\Sigma} =\left[\begin{array}{ll} A & C^{\top} \\ C & D \end{array}\right]$
对应的信息矩阵

$\mathbf{\Sigma}^{-1} = \left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]^{-1}=\left[\begin{array}{cc} A^{-1}+A^{-1} C^{\top} \Delta_{\mathrm{A}}^{-1} C A^{-1} & -A^{-1} C^{\top} \Delta_{\mathrm{A}}^{-1} \\ -\Delta_{\mathrm{A}}^{-1} C A^{-1} & \Delta_{\mathrm{A}}^{-1} \end{array}\right] \triangleq\left[\begin{array}{cc} \Lambda_{a a} & \Lambda_{a b} \\ \Lambda_{b a} & \Lambda_{b b} \end{array}\right]$

注意：

中间那一步是利用舒尔补求逆的过程，这里直接使用了上一小结的结论带入，,具体过程参考上一小结。

其中：
$\Delta_{\mathrm{A}}=\mathrm{D}-\mathbf{C A}^{-1} \mathbf{C}^{\top}$

根据对应关系，不难得出：
$\Delta_{A}^{-1}=\Lambda_{b b} \\ A^{-1}=\Lambda_{a a}-\Lambda_{a b} \Lambda_{b b}^{-1} \Lambda_{b a}$
或者：
$D^{-1}=\Lambda_{b b}-\Lambda_{b a} \Lambda_{a a}^{-1} \Lambda_{a b}$
这里的 $A^{-1}$ 或者 $D^{-1}$ 就是在下一次优化会使用的先验信息矩阵（又名：边际概率的信息矩阵）。

其他

关于边际概率和条件概率的使用，有兴趣的可以参考下一小节（先给出下一小节的结论）
$P(\boldsymbol{a}, \boldsymbol{b})=\mathcal{N}\left(\left[\begin{array}{l} \boldsymbol{\mu}_{a} \\ \boldsymbol{\mu}_{b} \end{array}\right],\left[\begin{array}{cc} \boldsymbol{\Sigma}_{a a} & \boldsymbol{\Sigma}_{a b} \\ \boldsymbol{\Sigma}_{b a} & \boldsymbol{\Sigma}_{b b} \end{array}\right]\right)=\mathcal{N}^{-1}\left(\left[\begin{array}{l} \eta_{a} \\ \eta_{b} \end{array}\right],\left[\begin{array}{cc} \boldsymbol{\Lambda}_{a a} & \boldsymbol{\Lambda}_{a a} \\ \boldsymbol{\Lambda}_{b a} & \boldsymbol{\Lambda}_{b b} \end{array}\right]\right)$

以及
$\begin{array}{|c|c|c|} \hline & \text { 边际概率 } & \text { 条件概率 } \\ & p(\boldsymbol{a})=\int p(\boldsymbol{a}, \boldsymbol{b}) d \boldsymbol{b} & p(\boldsymbol{a} \mid \boldsymbol{b})=p(\boldsymbol{a}, \boldsymbol{b}) / p(\boldsymbol{b}) \\ \hline {\text { 协方差矩阵 }} & \boldsymbol{\mu}=\boldsymbol{\mu}_{a} & \boldsymbol{\mu}^{\prime}=\boldsymbol{\mu}_{a}+\Sigma_{a b} \Sigma_{b b}^{-1}\left(\boldsymbol{b}-\boldsymbol{\mu}_{b}\right) \\ & \Sigma=\Sigma_{a a} & \Sigma^{\prime}=\Sigma_{a a}-\Sigma_{a b} \Sigma_{b b}^{-1} \Sigma_{b a} \\ \hline \text { 信息矩阵 } & \begin{array}{c} \boldsymbol{\eta}=\boldsymbol{\eta}_{a}-\Lambda_{a \beta} \Lambda_{b b}^{-1} \boldsymbol{\eta}_{b} \\ \Lambda=\Lambda_{a a}-\Lambda_{a b} \Lambda_{b b}{ }^{-1} \Lambda_{b a} \end{array} & \begin{array}{c} \boldsymbol{\eta}^{\prime}=\boldsymbol{\eta}_{a}-\Lambda_{a b} \boldsymbol{b} \\ {\Lambda^{\prime}=\Lambda_{a a}} \end{array} \\ \hline \end{array}$

1-5🔖用途：舒尔补应用于多元高斯分布

通过舒尔补分解多元高斯分布

假设多元变量 $\mathrm{x}$ 服从高斯分布，且由两部分组成： $\mathbf{x}=\left[\begin{array}{c}a \\ b\end{array}\right]$ , 变量之间构成的协方差矩阵为：
$\mathbf{K}=\left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]$
其中 $A=\operatorname{cov}(a, a), D=\operatorname{cov}(b, b), C=\operatorname{cov}(a, b)$ . 由此变量 $\mathrm{x}$ 的概率分布为：
$\mid a) \propto \exp \left(-\frac{1}{2}\left[\begin{array}{l} a \\ b \end{array}\right]^{\top}\left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]^{-1}\left[\begin{array}{l} a \\ b \end{array}\right]\right)$
利用舒尔补一节公式, 对高斯分布进行分解，得
$\begin{array}{l} P(a, b) \\ \propto \exp \left(-\frac{1}{2}\left[\begin{array}{l} a \\ b \end{array}\right]^{\top}\left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]^{-1}\left[\begin{array}{l} a \\ b \end{array}\right]\right) \\ \propto \exp \left(-\frac{1}{2}\left[\begin{array}{l} a \\ b \end{array}\right]^{\top}\left[\begin{array}{cc} I & -A^{-1} C^{\top} \\ 0 & I \end{array}\right]\left[\begin{array}{cc} A^{-1} & 0 \\ 0 & \Delta_{\mathrm{A}}^{-1} \end{array}\right]\left[\begin{array}{cc} I & 0 \\ -C A^{-1} & I \end{array}\right]\left[\begin{array}{l} a \\ b \end{array}\right]\right) \\ \propto \exp \left(-\frac{1}{2}\left[a^{\top} \quad\left(b-C A^{-1} a\right)^{\top}\right]\left[\begin{array}{cc} A^{-1} & 0 \\ 0 & \Delta_{\mathbf{A}}^{-1} \end{array}\right]\left[\begin{array}{c} a \\ b-C A^{-1} a \end{array}\right]\right) \\ \propto \exp \left(-\frac{1}{2}\left(a^{\top} A^{-1} a\right)+\left(b-C A^{-1} a\right)^{\top} \Delta_{\mathbf{A}}^{-1}\left(b-C A^{-1} a\right)\right) \\ \propto \underbrace{\exp \left(-\frac{1}{2} a^{\top} A^{-1} a\right)}_{p(a)} \underbrace{\exp \left(-\frac{1}{2}\left(b-C A^{-1} a\right)^{\top} \Delta_{\mathbf{A}}^{-1}\left(b-C A^{-1} a\right)\right)}_{p(b] a)} \end{array}$
这意味着我们能从多元高斯分布 $\mathrm{P}(\mathrm{a}, \mathrm{b})$ 中分解得到边际概率 $\mathrm{p}(\mathrm{a})$ 和条件概率 $\mathrm{p}(\mathrm{b} | \mathrm{a})$ 。

边际概率和条件概率的信息矩阵

假设我们已知信息矩阵：
$\left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]^{-1}=\left[\begin{array}{cc} \Lambda_{a a} & \Lambda_{a b} \\ \Lambda_{b a} & \Lambda_{b b} \end{array}\right]$
另外，由舒尔补矩阵求逆公式可知，协方差矩阵各块和信息矩阵之间有：
$\left[\begin{array}{cc} A & C^{\top} \\ C & D \end{array}\right]^{-1}=\left[\begin{array}{cc} A^{-1}+A^{-1} C^{\top} \Delta_{\mathrm{A}}^{-1} C A^{-1} & -A^{-1} C^{\top} \Delta_{\mathrm{A}}^{-1} \\ -\Delta_{\mathrm{A}}^{-1} C A^{-1} & \Delta_{\mathrm{A}}^{-1} \end{array}\right] \triangleq\left[\begin{array}{cc} \Lambda_{a a} & \Lambda_{a b} \\ \Lambda_{b a} & \Lambda_{b b} \end{array}\right]$
由条件概率 $\mid a)$ 的协方差为 $\Delta_{A}$ 以及公式, 易得其信息矩阵为
$\Delta_{A}^{-1}=\Lambda_{b b}$
由边际概率 $P (a)$ 的协方差为 $A$ 以及公式 , 易得其信息矩阵为：
$A^{-1}=\Lambda_{a a}-\Lambda_{a b} \Lambda_{b b}^{-1} \Lambda_{b a}$

总结

关于 $\bf{P(a)}$
$\begin{array}{l} P(a)=\int_{b} P(a, b) \\ P(a) \propto \exp \left(-\frac{1}{2} a^{\top} A^{-1} a\right) \sim \mathcal{N}(0, A) \end{array}$

启示：边际概率的协方差就是从联合分布中取对应的矩阵块就行了。

关于 $\bf{P(b | a)}$
$\propto \exp \left(-\frac{1}{2}\left(b-C A^{-1} a\right)^{\top} \Delta_{\mathbf{A}}^{-1}\left(b-C A^{-1} a\right)\right)$
启示： $\sim \mathcal{N}\left(C A^{-1} a, \Delta_{A}\right)$ 。协方差变为 $a$ 对应的舒尔补, 均值也变了。

最后
$P(\boldsymbol{a}, \boldsymbol{b})=\mathcal{N}\left(\left[\begin{array}{l} \boldsymbol{\mu}_{a} \\ \boldsymbol{\mu}_{b} \end{array}\right],\left[\begin{array}{cc} \boldsymbol{\Sigma}_{a a} & \boldsymbol{\Sigma}_{a b} \\ \boldsymbol{\Sigma}_{b a} & \boldsymbol{\Sigma}_{b b} \end{array}\right]\right)=\mathcal{N}^{-1}\left(\left[\begin{array}{l} \eta_{a} \\ \eta_{b} \end{array}\right],\left[\begin{array}{cc} \boldsymbol{\Lambda}_{a a} & \boldsymbol{\Lambda}_{a a} \\ \boldsymbol{\Lambda}_{b a} & \boldsymbol{\Lambda}_{b b} \end{array}\right]\right)$

参考资料

深蓝学院手写vio课程

雨luo凡城

关注

18
点赞
踩
61

收藏

觉得还不错? 一键收藏
4
评论
SLAM基础——舒尔补介绍

文章目录1:book: 舒尔补介绍1-1:bookmark: 舒尔补定义1-2:bookmark: 舒尔补的定理推导1-3 :bookmark: 用途：快速求矩阵的逆1-4:bookmark:用途：舒尔补在信息矩阵求解中的使用1-5:bookmark:用途：舒尔补应用于多元高斯分布通过舒尔补分解多元高斯分布边际概率和条件概率的信息矩阵总结参考资料1???? 舒尔补介绍1-1???? 舒尔补定义给定任意的矩阵块 M\mathbf{M}M ，如下所示:M=[ABCD]\mathbf{M}=\lef
复制链接

扫一扫