2.2 矩阵的逆（第2章矩阵代数）

最新推荐文章于 2024-10-06 09:41:31 发布

泰克尼客

最新推荐文章于 2024-10-06 09:41:31 发布

阅读量1.3w

点赞数 8

分类专栏：线性代数及其应用系列笔记文章标签：线性代数矩阵机器学习

本文链接：https://blog.csdn.net/wo94chunjie/article/details/103610130

版权

线性代数及其应用系列笔记专栏收录该内容

22 篇文章

订阅专栏

内容概述

本章首先由倒数的概念，引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来，讲解了可逆矩阵对应线性方程解的唯一性，以及可逆矩阵的几个有用的性质。本章的最后，讲解了计算逆矩阵的一种通用方法，即利用初等矩阵来计算逆矩阵。

由倒数引申出矩阵的逆

假设有一个实数 $5$ ， $5$ 的乘法逆是 $1 / 5$ 或 $5^{-1}$ ，它满足方程： $5^{-1} \cdot 5 = 1$ 和 $\cdot 5^{-1} = 1$ ，矩阵对逆的一般化也要求两个方程同时成立，所以当且仅当矩阵是方阵时，矩阵才有可能可逆（因为矩阵乘法要求左边矩阵的列等于右边矩阵的行，如果某个矩阵能同时满足左乘和右乘，那么只能是 $\times n$ 方阵）
定义：

一个 $\times n$ 矩阵 $A$ 是可逆的，若存在一个 $\times n$ 矩阵 $C$ ，使得：
$\boldsymbol I$
且
$\boldsymbol I$
其中 $\boldsymbol I = \boldsymbol I_n$ 是 $\times n$ 单位矩阵。这时称 $C$ 是 $A$ 的逆。

实际上， $C$ 由 $A$ 唯一确定，因为若 $B$ 是另一个 $A$ 的逆，那么将有 $\boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = C$ 。于是，若 $A$ 可逆，它的逆是唯一的，我们将它记为 $A^{-1}$ ，于是：
$A^{-1}A = \boldsymbol I$
且
$AA^{-1} = \boldsymbol I$
不可逆矩阵被称为奇异矩阵，而可逆矩阵也可称作非奇异矩阵。
例：

若 $A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}$ , $C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}$ ，则：
$\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}$
$CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}$
所以， $C=A^{-1}$

行列式

定理：

设 $\begin{bmatrix}a & b \\ c & d\end{bmatrix}$ ，若 $\neq 0$ ，则 $A$ 可逆且
$A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix}$
若 $a d - b c = 0$ ，则 $A$ 不可逆

定理的证明可以通过上述逆矩阵的定义公式来进行。数 $a d - b c$ 称为 $A$ 的行列式，记为：
$det\,A = ad -bc$
当且仅当 $det\,A \neq 0$ 时，上述 $\times 2$ 矩阵 $A$ 可逆。
例：

求 $A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix}$ 的逆

解：

因为 $det\,A = 3(6)-4(5)=-2 \neq 0$ ，所以 $A$ 可逆，且：
$A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}$

可逆矩阵对应线性方程解的唯一性

定理：

若 $A$ 是可逆 $\times n$ 矩阵，则对每一 $\mathbb R^n$ 中的 $\boldsymbol b$ ，方程 $A\boldsymbol x = \boldsymbol b$ 有唯一解 $\boldsymbol x = A^{-1}\boldsymbol b$

证明：

先证明 $A^{-1}\boldsymbol b$ 是方程的一个解：
因为 $A$ 可逆，那么若以 $A^{-1} \boldsymbol b$ 代替 $\boldsymbol x$ ，有： $A\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol b$ ，所以 $A^{-1}\boldsymbol b$ 是方程的一个解。
再证明解的唯一性：
假设 $\boldsymbol u$ 是方程的任意一个解，那么有： $A\boldsymbol u = \boldsymbol b$ ，由于 $A$ 可逆，那么方程两边同时乘以 $A^{-1}$ 得： $A^{-1}A\boldsymbol u = A^{-1}\boldsymbol b$ ，进一步推导有： $\boldsymbol I \boldsymbol u = A^{-1}\boldsymbol b$ ，也就是： $\boldsymbol u = A^{-1}\boldsymbol b$
得证

上述定理很少用来解方程 $A\boldsymbol x = \boldsymbol b$ ，因为 $\begin{bmatrix}A & \boldsymbol b\end{bmatrix}$ 的行化简通常更快。一个可能的例外是 $\times 2$ 矩阵，因为这时利用行列式计算 $A^{-1}$ 相对比较容易。
例：

求解方程组：
$\begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned}$

解:

$\boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix}$

可逆矩阵的几个性质

若 $A$ 是可逆矩阵，则 $A^{-1}$ 也可逆而且 $A^{-1})^{-1} = A$
若 $A$ 和 $B$ 都是可逆矩阵，则 $A B$ 也可逆，且其逆是 $A$ 和 $B$ 的逆矩阵按相反顺序的乘积，即： $AB)^{-1} = B^{-1}A^{-1}$
若 $A$ 可逆，则 $A^{T}$ 也可逆，且其逆是 $A^{-1}$ 的转置，即 $A^{T})^{-1}=(A^{-1})^{T}$

简单证明上述第2个性质：

从逆矩阵定义出发，要证明 $B^{-1}A^{-1}$ 是 $A B$ 的逆矩阵，则要证明 $A B$ 左乘和右乘 $B^{-1}A^{-1}$ 的积都是 $\boldsymbol I$ 。以右乘为例： $(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I$ 。同理可以证明左乘的情况一样成立。

初等矩阵

定义：

把单位矩阵进行一次初等行变换，就得到初等矩阵。

例：

下面 $E_1$ 是一个对应倍加变换的初等矩阵：
$E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}$
下面 $E_2$ 是一个对应对换变换的初等矩阵：
$E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix}$
下面 $E_3$ 是一个对应倍乘变换的初等矩阵：
$E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix}$
假设有一个矩阵 $A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix}$ ，观察 $E_1A$ ， $E_2A$ ， $E_3A$ 所起的作用。

解：

经过计算可知：
$E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix}$
$E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix}$
$E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix}$
从上述可知，这些乘积可由 $A$ 进行 $E_i$ 暗含的初等行变换得到。

还需注意：

把 $\times n$ 矩阵左乘以（即在左边相乘）上述 $E_i$ ，均会产生相应的效果。
特别地， $E_i \boldsymbol I = E_i$ ，也就是说， $E_i$ 本身是把单位矩阵以同一行变换作用所得。
因此可以得到如下的一般结论：

若对 $\times n$ 矩阵 $A$ 进行某种初等行变换，所得矩阵可写成 $E A$ ，其中 $E$ 是 $\times m$ 矩阵，是由 $\boldsymbol I_m$ 进行统一行变换所得。

因为行变换是可逆的，故初等矩阵也是可逆的。若 $E$ 是由 $\boldsymbol I$ 进行行变换所得，则有同一类型的另一行变换把 $E$ 变回 $\boldsymbol I$ 。因此，由初等矩阵 $F$ ，使得 $\boldsymbol I$ 。因为 $E$ 和 $F$ 对应于互逆的变换，所以也有 $EF=\boldsymbol I$ 。

每个初等矩阵 $E$ 是可逆的， $E$ 的逆是一个同类型的初等矩阵，它把 $E$ 变回 $\boldsymbol I$ 。

例：

求 $E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}$ 的逆。

解：

为把 $E_1$ 变成 $\boldsymbol I$ ，需要把第1行的4倍加到第3行，这相应于初等矩阵：
$E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix}$

矩阵可逆的判定以及逆矩阵的计算方法

定理：

$\times n$ 矩阵 $A$ 是可逆的，当且仅当 $A$ 行等价于 $\boldsymbol I_n$ ，这时，把 $A$ 化简为 $\boldsymbol I_n$ 的一系列初等行比那换同时把 $\boldsymbol I_n$ 变成 $A^{-1}$

证明：

设 $A$ 是可逆矩阵，则对任意 $\boldsymbol b$ ，方程 $A\boldsymbol x = \boldsymbol b$ 有解（参照本文前半段的定理），这就说明， $A$ 在每一行有一个主元位置。又因为 $A$ 是方阵，所以这 $n$ 个主元位置必在对角线上，相应的， $A$ 的简化阶梯形是 $\boldsymbol I_n$ ，即 $\sim \boldsymbol I_n$ 。
反之，若 $\sim \boldsymbol I_n$ ，则因为每一步行化简对应于左乘一个初等矩阵，所以存在初等矩阵 $E_1, \cdots, E_p$ ，使得：
$\sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n$
即：
$E_pE_{p-1} \cdots E_1A=\boldsymbol I_n$
因为 $E_p \cdots E_1$ 是可逆矩阵的乘积，因此其也是可逆矩阵（这点可以参考上述的两点知识：1. 初等矩阵是可逆的；2. 如果两个矩阵是可逆的，那么两个矩阵的乘积也是可逆的），那么可以根据上式推出：
$\begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned}$
这说明了 $A$ 是可逆矩阵 $E_p \cdots E_1$ 的逆，又由于上述定理所述（可逆矩阵的逆矩阵也可逆），有：
$A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1$

由上述定理的证明过程，自然而然可以引出计算矩阵逆矩阵的一种方法：

把 $A$ 和 $\boldsymbol I$ 排在一起构成增广矩阵 $\begin{bmatrix}A & \boldsymbol I\end{bmatrix}$ ，则对此矩阵进行行变换时， $A$ 和 $\boldsymbol I$ 收到同一变换。要么有一系列的行变换把 $A$ 变成 $\boldsymbol I$ ，同时把 $\boldsymbol I$ 变成 $A^{-1}$ ，要么 $A$ 是不可逆的。

精确描述如下：

把增广矩阵 $\begin{bmatrix}A & \boldsymbol I\end{bmatrix}$ 进行行化简。若 $A$ 行等价于 $\boldsymbol I$ ，则 $\begin{bmatrix}A & \boldsymbol I\end{bmatrix}$ 行等价于 $\begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix}$ ，否则 $A$ 没有逆。

例：

求矩阵 $\begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix}$ 的逆，假如它存在。

解：

$\begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned}$
由上述定理，可知 $A$ 可逆，且：
$A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix}$

可逆矩阵的另一个观点

假设 $A$ 可逆，那么有： $AA^{-1} = \boldsymbol I$ 。由矩阵乘法的定义， $A$ 乘以 $A^{-1}$ ，就是用 $A$ 去乘以 $A^{-1}$ 的每一列。假设 $A^{-1}$ 的每一行按序号为 $\boldsymbol x_i$ ，那么有： $\begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix}$ 。要求解逆矩阵 $A^{-1}$ 的某一列 $\boldsymbol x_i$ ，只需要求解方程
$A\boldsymbol x_i = \boldsymbol e_i$
即可。这一点是很有用的，因为在某些问题中，只需要 $A^{-1}$ 的一列或两列。