2.4 分块矩阵（第2章矩阵代数）

泰克尼客

已于 2022-01-21 14:28:35 修改

阅读量2.1k

点赞数 1

分类专栏：线性代数及其应用系列笔记文章标签：线性代数矩阵机器学习深度学习

于 2020-01-02 09:55:33 首次发布

本文链接：https://blog.csdn.net/wo94chunjie/article/details/103785600

版权

线性代数及其应用系列笔记专栏收录该内容

22 篇文章 64 订阅

订阅专栏

主要内容

本节引入了分块矩阵的概念，讲解了分块矩阵的乘法运算（将子矩阵当作数处理），并由此引出了看待矩阵乘法的另一种观点（左边矩阵的列乘以右边矩阵的行），最后讲解了分块矩阵的逆矩阵是如何运算的。

分块矩阵的概念

之前，我们尝试过把矩阵看作一个数的矩形表，也可以把矩阵看作一组列向量，现在可以尝试以另一种新的角度来看待矩阵，也就是用水平线和垂直线将它分割成几块，如下图的矩阵 $A$ 。以这种观点来看矩阵，可以使得矩阵许多本质的结构显露出来。
$\begin{bmatrix} \begin{array}{ccc | cc | c} 3 & 0 & -1 & 5 & 9 & -2 \\ -5 & 2 & 4 & 0 & -3 & 1 \\ \hline -8 & -6 & 3 & 1 & 7 & -4 \end{array} \end{bmatrix}$
上述矩阵 $A$ 也可写成 $\times 3$ 分块矩阵：
$\begin{bmatrix}A_{11} & A_{12} & A{13} \\ A_{21} & A_{22} & A_{23} \end{bmatrix}$
的形状，它的元素是分块（或子矩阵）：
$A_{11} = \begin{bmatrix}3 & 0 & -1 \\ -5 & 2 & 4 \end{bmatrix}$ ， $A_{12} = \begin{bmatrix}5 & 9 \\ 0 & -3 \end{bmatrix}$ ， $A_{13} = \begin{bmatrix}-2 \\ 1 \end{bmatrix}$
$A_{21} = \begin{bmatrix}-8 & 6 & 3 \end{bmatrix}$ ， $A_{22} = \begin{bmatrix}1 & 7 \end{bmatrix}$ ， $A_{23} = \begin{bmatrix} -4 \end{bmatrix}$

例：

若一个微型计算机电路板主要由3块超大规模的集成电路芯片组成，那么该电路板的矩阵可以写成一般形式：
$\begin{bmatrix} \begin{array}{c| c | c} A_{11} & A_{12} & A_{13} \\ \hline A_{21} & A_{22} & A_{23} \\ \hline A_{31} & A_{32} & A_{33} \end{array} \end{bmatrix}$
$A$ 的对角线上的子矩阵（即 $A_{11}$ ， $A_{22}$ 和 $A_{33}$ ）是有关三块超大规模集成电路本身的矩阵，而其他子矩阵则与这三块芯片之间的相互联系有关。

分块矩阵的乘法

分块矩阵也可用通常的行列法则进行乘法运算，就如每一块都是数一样，只要对于乘积 $A B$ ， $A$ 的列的分法与 $B$ 的行的分法一致。

例：

设
$\begin{bmatrix}\begin{array}{ccc | cc} 2 & -3 & 1 & 0 & -4 \\ 1 & 5 & -2 & 3 & 1 \\ \hline 0 & -4 & -2 & 7 & -1 \end{array} \end{bmatrix} = \begin{bmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{bmatrix}$ ，
$B=\begin{bmatrix}6 & 4 \\ -2 & 1 \\ -3 & 7 \\ \hline \ -1 & 3 \\5 & 2 \end{bmatrix}$
$A$ 的5列被分成3列一组和2列一组。 $B$ 的5行按同样方法分块——被分成3行一组和2列一组。我们称 $A$ 和 $B$ 的分块是与分块乘法相一致的。 $A B$ 的乘积可以被写成：
$\begin{bmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{bmatrix} \begin{bmatrix}B_1 \\ B_2\end{bmatrix} = \begin{bmatrix}A_{11}B_1 + A_{12}B_2 \\ A_{21}B_1 + A_{22}B_2\end{bmatrix} = \begin{bmatrix}-5 & 4 \\ -6 & 2 \\ \hline 2 & 1\end{bmatrix}$

之前，我们已经学习过，从不同的角度去看待矩阵的乘积 $A B$ 。例如：

使用 $A$ 的列来给出 $A\boldsymbol x$ 的定义；
$A B$ 的列的定义
计算 $A B$ 的行列法则
$A$ 的行与矩阵 $B$ 的乘积作为 $A B$ 的行

从上述矩阵相乘的行列法则，可以给出两个矩阵乘积的最一般观点。试想，将 $A$ 切成若干个只有一列的子矩阵，将 $B$ 切割成只有一行的若干子矩阵，那么根据分块矩阵的运算法则，可以得出矩阵乘积的一般性规律。
例：

设 $\begin{bmatrix}-3 & 1 & 2 \\ 1 & -4 & 5\end{bmatrix}$ 和 $\begin{bmatrix}a & b \\ c & d \\ e & f\end{bmatrix}$ ，验证：
$AB=col_1(A)row_1(B)+col_2(A)row_2(B)+col_3(A)row_3(B)$

解：

由计算矩阵乘积的行列法则，有：
$col_1(A)row_1(B) = \begin{bmatrix}-3 \\ 1\end{bmatrix}\begin{bmatrix}a & b\end{bmatrix} = \begin{bmatrix}-3a & -3b \\ a & b\end{bmatrix}$
$col_2(A)row_2(B) = \begin{bmatrix}1 \\ -4\end{bmatrix}\begin{bmatrix}c & d\end{bmatrix} = \begin{bmatrix}c & d \\ -4c & -4d\end{bmatrix}$
$col_3(A)row_3(B) = \begin{bmatrix}2 \\ 5\end{bmatrix}\begin{bmatrix}e & f\end{bmatrix} = \begin{bmatrix}2e & 2f \\ 5e & 5f\end{bmatrix}$
于是，
$\sum_{k=1}^{3}col_k(A)row_k(B) = \begin{bmatrix}-3a+c+2e & -3b+d+2f \\ a-4c+5e & b-4d+5f\end{bmatrix}$
这个矩阵恰好就是 $A B$ 。

定理：

若 $A$ 是 $\times n$ 矩阵， $B$ 是 $\times p$ 矩阵，则：
$\begin{aligned}AB &= \begin{bmatrix}col_1(A) & col_2(A) & ... & col_n(A)\end{bmatrix} \begin{bmatrix}row_1(B) & row_2(B) & ... & row_n(B)\end{bmatrix} \\&= col_1(A)row_1(B) + ... +col_n(A)row_n(B)\end{aligned}$

证：

对每个行指标 $i$ 和列指标 $j$ ，乘积 $col_k(A)row_k(B)$ 的 $(i, j)$ 元素是 $col_k(A)$ 中元素 $a_{ik}$ 与 $row_k(B)$ 中元素 $b_{kj}$ 的积，因此， $(i, j)$ 元素为：
$a_{i1} b_{1j} + a_{i2}b_{2j} + ... + a_{in}b_{nj}$
根据行列法则，该和恰好是 $A B$ 的 $(i, j)$ 元素。

分块矩阵的逆

例：

形如 $\begin{bmatrix}A_{11} & A_{12} \\ 0 & A_{22}\end{bmatrix}$ 的矩阵称为分块上三角矩阵。设 $A_{11}$ 是 $\times p$ 矩阵， $A_{22}$ 是 $\times q$ 矩阵，且 $A$ 为可逆矩阵。求 $A^{-1}$ 的表达式。

解：

用 $B$ 表示 $A^{-1}$ 且把它分块，使得：
$\begin{bmatrix}A_{11} & A_{12} \\ 0 & A_{22}\end{bmatrix} \begin{bmatrix}B_{11} & B_{12} \\ B_{21} & B_{22}\end{bmatrix} = \begin{bmatrix}\boldsymbol I_p & 0 \\ 0 & \boldsymbol I_q\end{bmatrix}$
根据矩阵计算法则，可得如下四个等式：
$\begin{aligned} A_{11}B_{11} + A_{12}B_{21} &= \boldsymbol I_p \\ A_{11}B_{12} + A_{12}B_{22} &= 0\\ A_{22}B_{21} &= 0 \\ A_{22}B_{22} &= \boldsymbol I_q \end{aligned}$
（1）由于 $A_{22}$ 是方阵，且 $A_{22}B_{22} = \boldsymbol I_q$ ，根据可逆矩阵定理，可以断定 $A_{22}$ 可逆且 $B_{22}=A_{22}^{-1}$
（2）由于 $A_{22}$ 可逆，那么方程 $A_{22}B_{21}=0$ 两边同时乘以 $A_{22}^{-1}$ ，可得： $B_{21}=A_{22}^{-1}0=0$
（3）因此，上述第一个式子 $A_{11}B_{11}+A_{12}B{12}=\boldsymbol I_p$ 可化简为： $A_{11}B_{11}+0=0$ ，由于 $A_{11}$ 是方阵，这说明 $A_{11}$ 是可逆的，且 $B_{11}=A_{11}^{-1}$
（4）将 $B_{22}=A_{22}^{-1}$ 代入到上述第二个式子 $A_{11}B_{12}+A_{12}B_{22}=0$ ，可以得到： $B_{12}=-A_{11}^{-1}A_{12}A_{22}^{-1}$
综上，
$A^{-1}=\begin{bmatrix}A_{11}^{-1} & -A_{11}^{-1}A_{12}A_{22}^{-1} \\ 0 & A_{22}^{-1}\end{bmatrix}$