矩阵的舒尔补(Schur complement)

最新推荐文章于 2024-04-24 08:11:50 发布

百把人

最新推荐文章于 2024-04-24 08:11:50 发布

阅读量2.8w

点赞数 58

分类专栏：线代文章标签：线性代数

本文链接：https://blog.csdn.net/sheagu/article/details/115771184

版权

线代专栏收录该内容

3 篇文章 6 订阅

订阅专栏

1. 舒尔补的定义

设一个 $(p+q)\times (p+q)$ 维的矩阵 $M$ 被分成4个部分：
$\left[ \begin{matrix} A & B \\ C & D \end{matrix} \right]$
其中 $A$ 是 $p\times p$ 矩阵， $D$ 是 $q\times q$ 矩阵， $B$ 和 $C$ 取适配的维数。
1）当 $D$ 可逆时， $D$ 在 $M$ 中的舒尔补存在，且为：
$A-BD^{-1}C$
2）当 $A$ 可逆时， $A$ 在 $M$ 中的舒尔补存在，且为：
$D-CA^{-1}B$

2. 为什么是这个形式

虽然看起来很莫名，但舒尔补其实是对 $M$ 进行初等变换之后，得到的矩阵里的一个分块。例如，下面的这个转换矩阵
$\left[ \begin{matrix} I_p & 0 \\ -D^{-1}C & D^{-1} \end{matrix} \right]$
可以把 $M$ 变成
$\left[ \begin{matrix} A & B \\ C & D \end{matrix} \right] \left[ \begin{matrix} I_p & 0 \\ -D^{-1}C & D^{-1} \end{matrix} \right]= \left[ \begin{matrix} A-BD^{-1}C & BD^{-1} \\ 0 & I_q \end{matrix} \right]$
这个 $M L$ 左上角的分块就是 $D$ 的舒尔补了。
对 $A$ 来说，也有类似的变换。

3. 舒尔补有什么用

3.1 它可以用来判断矩阵 $M$ 的可逆性

如果已知 $M$ （那么 $A, B, C, D$ 都是已知的）并且 $A$ 可逆，那么 $A^{-1}$ 存在，可以对 $M$ 进行下面的行列变换：
$\left[ \begin{matrix} I & 0 \\ -CA^{-1} & I \end{matrix} \right] \left[ \begin{matrix} A & B \\ C & D \end{matrix} \right] \left[ \begin{matrix} I & -A^{-1}B \\ 0 & I \end{matrix} \right]= \left[ \begin{matrix} A & 0 \\ 0 & D-CA^{-1}B \end{matrix} \right]$
由于 $M$ 左右乘的都是对角线为1的矩阵，因此对上式左右两边取行列式，可以得到：
$\left| \begin{array}{cccc} A & B \\ C & D \end{array} \right|= \left| \begin{array}{cccc} A & 0 \\ 0 & D-CA^{-1}B \end{array} \right|= |A|\cdot|D-CA^{-1}B|$
由于已知 $A$ 可逆，上面的式子说明 $M$ 和 $D-CA^{-1}B$ 的可逆性是相同的。即：如果 $D-CA^{-1}B$ 可逆，那么可以判断 $M$ 是可逆的。
同理，如果 $D$ 可逆，那么 $M$ 和 $A-BD^{-1}C$ 的可逆性是相同的。即：如果 $A-BD^{-1}C$ 可逆，那么可以判断 $M$ 是可逆的。

3.2 $M$ 可逆时，它还能求出这个逆矩阵

根据3.1可以知道，如果 $D$ 可逆，那么 $M$ 和 $A-BD^{-1}C$ 的可逆性是相同的，具体地， $M^{-1}$ 可以表示为：
$\left[ \begin{matrix} A & B \\ C & D \end{matrix} \right]^{-1}= \left[ \begin{matrix} I & 0 \\ -D^{-1}C & D^{-1} \end{matrix} \right] \left[ \begin{matrix} (A-BD^{-1}C)^{-1} & 0 \\ 0 & I \end{matrix} \right] \left[ \begin{matrix} I & -BD^{-1} \\ 0 & I \end{matrix} \right]\\ =\left[ \begin{matrix} (A-BD^{-1}C)^{-1} & -(A-BD^{-1}C)^{-1}BD^{-1} \\ -D^{-1}C(A-BD^{-1}C)^{-1} & D^{-1}+D^{-1}C(A-BD^{-1}C)^{-1}BD^{-1} \end{matrix} \right]$
取一个特殊情况，例如 $p = q = 1$ 时，可以得到
$M^{-1}=\frac{1}{AD-BC} \left[ \begin{matrix} D & -B \\ -C & A \end{matrix} \right]$
这就是二阶矩阵的逆矩阵，与我们用伴随矩阵求出来的形式是相符的。

3.3 在求解矩阵方程组时，可以用来降低计算复杂度

如果我们要求解由两个矩阵方程组成的矩阵方程组，例如：
$Ax+By=a(1)\\ Cx+Dy=b(2)$
我们可以对两个方程增广来求解，即求解
$\left[ \begin{matrix} A & B \\ C & D \end{matrix} \right] \left[ \begin{matrix} x \\ y \end{matrix} \right]= \left[ \begin{matrix} a \\ b \end{matrix} \right]$
但增广后的阶数就增大了，计算复杂度更大。
利用舒尔补，如果 $D$ 可逆，那么对式(2)左乘 $BD^{-1}$ 就可以得到：
$BD^{-1}Cx+By=BD^{-1}b(3)$
由(1)-(3)得：
$A-BD^{-1}C)x=a-BD^{-1}b$
因此可以解出
$x=(A-BD^{-1}C)^{-1}(a-BD^{-1}b)$
代入(2)可以进一步解出 $y$ 。由于 $x$ 和 $y$ 的表达式的阶数都和原来单个方程的阶数相等，因此复杂度比第一种方法低。