2.2 矩阵的逆(第2章矩阵代数)

内容概述

本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。

由倒数引申出矩阵的逆

假设有一个实数 5 5 5 5 5 5的乘法逆是 1 / 5 1/5 1/5 5 − 1 5^{-1} 51,它满足方程: 5 − 1 ⋅ 5 = 1 5^{-1} \cdot 5 = 1 515=1 5 ⋅ 5 − 1 = 1 5 \cdot 5^{-1} = 1 551=1,矩阵对逆的一般化也要求两个方程同时成立,所以当且仅当矩阵是方阵时,矩阵才有可能可逆(因为矩阵乘法要求左边矩阵的列等于右边矩阵的行,如果某个矩阵能同时满足左乘和右乘,那么只能是 n × n n \times n n×n方阵)
定义:

一个 n × n n \times n n×n矩阵 A A A是可逆的,若存在一个 n × n n \times n n×n矩阵 C C C,使得:
C A = I CA = \boldsymbol I CA=I

A C = I AC = \boldsymbol I AC=I
其中 I = I n \boldsymbol I = \boldsymbol I_n I=In n × n n \times n n×n单位矩阵。这时称 C C C A A A的逆。

实际上, C C C A A A唯一确定,因为若 B B B是另一个 A A A的逆,那么将有 B = B I = B ( A C ) = ( B A ) C = I C = C B=B \boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = C B=BI=B(AC)=(BA)C=IC=C。于是,若 A A A可逆,它的逆是唯一的,我们将它记为 A − 1 A^{-1} A1,于是:
A − 1 A = I A^{-1}A = \boldsymbol I A1A=I

A A − 1 = I AA^{-1} = \boldsymbol I AA1=I
不可逆矩阵被称为奇异矩阵,而可逆矩阵也可称作非奇异矩阵
例:

A = [ 2 5 − 3 − 7 ] A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} A=[2357], C = [ − 7 − 5 3 2 ] C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix} C=[7352],则:
A C = [ 2 5 − 3 − 7 ] [ − 7 − 5 3 2 ] = [ 1 0 0 1 ] AC = \begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} AC=[2357][7352]=[1001]
C A = [ − 7 − 5 3 2 ] [ 2 5 − 3 − 7 ] = [ 1 0 0 1 ] CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} CA=[7352][2357]=[1001]
所以, C = A − 1 C=A^{-1} C=A1

行列式

定理:

A = [ a b c d ] A = \begin{bmatrix}a & b \\ c & d\end{bmatrix} A=[acbd],若 a d − b c ≠ 0 ad - bc \neq 0 adbc=0,则 A A A可逆且
A − 1 = 1 a d − b c [ d − b − c a ] A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix} A1=adbc1[dcba]
a d − b c = 0 ad - bc = 0 adbc=0,则 A A A不可逆

定理的证明可以通过上述逆矩阵的定义公式来进行。数 a d − b c ad-bc adbc称为 A A A的行列式,记为:
d e t   A = a d − b c det\,A = ad -bc detA=adbc
当且仅当 d e t   A ≠ 0 det\,A \neq 0 detA=0时,上述 2 × 2 2 \times 2 2×2矩阵 A A A可逆。
例:

A = [ 3 4 5 6 ] A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix} A=[3546]的逆

解:

因为 d e t   A = 3 ( 6 ) − 4 ( 5 ) = − 2 ≠ 0 det\,A = 3(6)-4(5)=-2 \neq 0 detA=3(6)4(5)=2=0,所以 A A A可逆,且:
A − 1 = 1 − 2 [ 6 − 4 − 5 3 ] = [ − 3 2 5 / 2 − 3 / 2 ] A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix} A1=21[6543]=[35/223/2]

可逆矩阵对应线性方程解的唯一性

定理:

A A A是可逆 n × n n \times n n×n矩阵,则对每一 R n \mathbb R^n Rn中的 b \boldsymbol b b,方程 A x = b A\boldsymbol x = \boldsymbol b Ax=b有唯一解 x = A − 1 b \boldsymbol x = A^{-1}\boldsymbol b x=A1b

证明:

先证明 A − 1 b A^{-1}\boldsymbol b A1b是方程的一个解:
因为 A A A可逆,那么若以 A − 1 b A^{-1} \boldsymbol b A1b代替 x \boldsymbol x x,有: A x = A ( A − 1 b ) = ( A A − 1 ) b = I b = b A\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol b Ax=A(A1b)=(AA1)b=Ib=b,所以 A − 1 b A^{-1}\boldsymbol b A1b是方程的一个解。
再证明解的唯一性:
假设 u \boldsymbol u u是方程的任意一个解,那么有: A u = b A\boldsymbol u = \boldsymbol b Au=b,由于 A A A可逆,那么方程两边同时乘以 A − 1 A^{-1} A1得: A − 1 A u = A − 1 b A^{-1}A\boldsymbol u = A^{-1}\boldsymbol b A1Au=A1b,进一步推导有: I u = A − 1 b \boldsymbol I \boldsymbol u = A^{-1}\boldsymbol b Iu=A1b,也就是: u = A − 1 b \boldsymbol u = A^{-1}\boldsymbol b u=A1b
得证

上述定理很少用来解方程 A x = b A\boldsymbol x = \boldsymbol b Ax=b,因为 [ A b ] \begin{bmatrix}A & \boldsymbol b\end{bmatrix} [Ab]的行化简通常更快。一个可能的例外是 2 × 2 2 \times 2 2×2矩阵,因为这时利用行列式计算 A − 1 A^{-1} A1相对比较容易。
例:

求解方程组:
3 x 1 + 4 x 2 = 3 5 x 1 + 6 x 2 = 7 \begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned} 3x1+4x2=35x1+6x2=7

解:

x = A − 1 b = [ − 3 2 5 / 2 − 3 / 2 ] [ 3 7 ] = [ 5 − 3 ] \boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix} x=A1b=[35/223/2][37]=[53]

可逆矩阵的几个性质

  1. A A A是可逆矩阵,则 A − 1 A^{-1} A1也可逆而且 ( A − 1 ) − 1 = A (A^{-1})^{-1} = A (A1)1=A
  2. A A A B B B都是可逆矩阵,则 A B AB AB也可逆,且其逆是 A A A B B B的逆矩阵按相反顺序的乘积,即: ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} (AB)1=B1A1
  3. A A A可逆,则 A T A^{T} AT也可逆,且其逆是 A − 1 A^{-1} A1的转置,即 ( A T ) − 1 = ( A − 1 ) T (A^{T})^{-1}=(A^{-1})^{T} (AT)1=(A1)T

简单证明上述第2个性质:

从逆矩阵定义出发,要证明 B − 1 A − 1 B^{-1}A^{-1} B1A1 A B AB AB的逆矩阵,则要证明 A B AB AB左乘和右乘 B − 1 A − 1 B^{-1}A^{-1} B1A1的积都是 I \boldsymbol I I。以右乘为例: ( A B ) ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A I A − 1 = A A − 1 = I (AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I (AB)(B1A1)=A(BB1)A1=AIA1=AA1=I。同理可以证明左乘的情况一样成立。

初等矩阵

定义:

单位矩阵进行一次初等行变换,就得到初等矩阵

例:

下面 E 1 E_1 E1是一个对应倍加变换的初等矩阵:
E 1 = [ 1 0 0 0 1 0 − 4 0 1 ] E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix} E1=104010001
下面 E 2 E_2 E2是一个对应对换变换的初等矩阵:
E 2 = [ 0 1 0 1 0 0 0 0 1 ] E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix} E2=010100001
下面 E 3 E_3 E3是一个对应倍乘变换的初等矩阵:
E 3 = [ 1 0 0 0 1 0 0 0 5 ] E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix} E3=100010005
假设有一个矩阵 A = [ a b c d e f g h i ] A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix} A=adgbehcfi,观察 E 1 A E_1A E1A E 2 A E_2A E2A E 3 A E_3A E3A所起的作用。

解:

经过计算可知:
E 1 A = [ a b c d e f g − 4 a h − 4 a i − 4 c ] E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix} E1A=adg4abeh4acfi4c
E 2 A = [ d e f a b c g h i ] E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix} E2A=dagebhfci
E 3 A = [ a b c d e f 5 g 5 h 5 i ] E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix} E3A=ad5gbe5hcf5i
从上述可知,这些乘积可由 A A A进行 E i E_i Ei暗含的初等行变换得到。

还需注意:

  1. 3 × n 3 \times n 3×n矩阵左乘以(即在左边相乘)上述 E i E_i Ei,均会产生相应的效果。
  2. 特别地, E i I = E i E_i \boldsymbol I = E_i EiI=Ei,也就是说, E i E_i Ei本身是把单位矩阵以同一行变换作用所得。
    因此可以得到如下的一般结论:

若对 m × n m \times n m×n矩阵 A A A进行某种初等行变换,所得矩阵可写成 E A EA EA,其中 E E E m × m m \times m m×m矩阵,是由 I m \boldsymbol I_m Im进行统一行变换所得。

因为行变换是可逆的,故初等矩阵也是可逆的。若 E E E是由 I \boldsymbol I I进行行变换所得,则有同一类型的另一行变换把 E E E变回 I \boldsymbol I I。因此,由初等矩阵 F F F,使得 F E = I FE = \boldsymbol I FE=I。因为 E E E F F F对应于互逆的变换,所以也有 E F = I EF=\boldsymbol I EF=I

每个初等矩阵 E E E是可逆的, E E E的逆是一个同类型的初等矩阵,它把 E E E变回 I \boldsymbol I I

例:

E 1 = [ 1 0 0 0 1 0 − 4 0 1 ] E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix} E1=104010001的逆。

解:

为把 E 1 E_1 E1变成 I \boldsymbol I I,需要把第1行的4倍加到第3行,这相应于初等矩阵:
F = E 1 − 1 = [ 1 0 0 0 1 0 4 0 1 ] F = E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix} F=E11=104010001

矩阵可逆的判定以及逆矩阵的计算方法

定理:

n × n n \times n n×n矩阵 A A A是可逆的,当且仅当 A A A行等价于 I n \boldsymbol I_n In,这时,把 A A A化简为 I n \boldsymbol I_n In的一系列初等行比那换同时把 I n \boldsymbol I_n In变成 A − 1 A^{-1} A1

证明:

A A A是可逆矩阵,则对任意 b \boldsymbol b b,方程 A x = b A\boldsymbol x = \boldsymbol b Ax=b有解(参照本文前半段的定理),这就说明, A A A在每一行有一个主元位置。又因为 A A A是方阵,所以这 n n n个主元位置必在对角线上,相应的, A A A的简化阶梯形是 I n \boldsymbol I_n In,即 A ∼ I n A \sim \boldsymbol I_n AIn
反之,若 A ∼ I n A \sim \boldsymbol I_n AIn,则因为每一步行化简对应于左乘一个初等矩阵,所以存在初等矩阵 E 1 , ⋯   , E p E_1, \cdots, E_p E1,,Ep,使得:
A ∼ E 1 A ∼ E 2 ( E 1 A ) ∼ ⋯ ∼ E p ( E p − 1 ⋯ E 1 A ) = I n A \sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n AE1AE2(E1A)Ep(Ep1E1A)=In
即:
E p E p − 1 ⋯ E 1 A = I n E_pE_{p-1} \cdots E_1A=\boldsymbol I_n EpEp1E1A=In
因为 E p ⋯ E 1 E_p \cdots E_1 EpE1是可逆矩阵的乘积,因此其也是可逆矩阵(这点可以参考上述的两点知识:1. 初等矩阵是可逆的;2. 如果两个矩阵是可逆的,那么两个矩阵的乘积也是可逆的),那么可以根据上式推出:
( E p ⋯ E 1 ) − 1 ( E p ⋯ E 1 ) A = ( E p ⋯ E 1 ) − 1 I n A = ( E p ⋯ E 1 ) − 1 \begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned} (EpE1)1(EpE1)AA=(EpE1)1In=(EpE1)1
这说明了 A A A是可逆矩阵 E p ⋯ E 1 E_p \cdots E_1 EpE1的逆,又由于上述定理所述(可逆矩阵的逆矩阵也可逆),有:
A − 1 = [ ( E p ⋯ E 1 ) − 1 ] − 1 = E p ⋯ E 1 A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1 A1=[(EpE1)1]1=EpE1

由上述定理的证明过程,自然而然可以引出计算矩阵逆矩阵的一种方法:

A A A I \boldsymbol I I排在一起构成增广矩阵 [ A I ] \begin{bmatrix}A & \boldsymbol I\end{bmatrix} [AI],则对此矩阵进行行变换时, A A A I \boldsymbol I I收到同一变换。要么有一系列的行变换把 A A A变成 I \boldsymbol I I,同时把 I \boldsymbol I I变成 A − 1 A^{-1} A1,要么 A A A是不可逆的。

精确描述如下:

把增广矩阵 [ A I ] \begin{bmatrix}A & \boldsymbol I\end{bmatrix} [AI]进行行化简。若 A A A行等价于 I \boldsymbol I I,则 [ A I ] \begin{bmatrix}A & \boldsymbol I\end{bmatrix} [AI]行等价于 [ I A − 1 ] \begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix} [IA1],否则 A A A没有逆。

例:

求矩阵 A = [ 0 1 2 1 0 3 4 − 3 8 ] A = \begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix} A=014103238的逆,假如它存在。

解:

[ A I ] = [ 0 1 2 1 0 0 1 0 3 0 1 0 4 − 3 8 0 0 1 ] ∼ [ 1 0 0 − 9 / 2 7 − 3 / 2 0 1 0 − 2 4 − 1 0 0 1 3 / 2 − 2 1 / 2 ] \begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned} [AI]=0141032381000100011000100019/223/27423/211/2
由上述定理,可知 A A A可逆,且:
A − 1 = [ − 9 / 2 7 − 3 / 2 − 2 4 − 1 3 / 2 − 2 1 / 2 ] A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix} A1=9/223/27423/211/2

可逆矩阵的另一个观点

假设 A A A可逆,那么有: A A − 1 = I AA^{-1} = \boldsymbol I AA1=I。由矩阵乘法的定义, A A A乘以 A − 1 A^{-1} A1,就是用 A A A去乘以 A − 1 A^{-1} A1的每一列。假设 A − 1 A^{-1} A1的每一行按序号为 x i \boldsymbol x_i xi,那么有: [ A x 1 A x 2 ⋯ A x n ] = [ e 1 e 2 ⋯ e n ] \begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix} [Ax1Ax2Axn]=[e1e2en]。要求解逆矩阵 A − 1 A^{-1} A1的某一列 x i \boldsymbol x_i xi,只需要求解方程
A x i = e i A\boldsymbol x_i = \boldsymbol e_i Axi=ei
即可。这一点是很有用的,因为在某些问题中,只需要 A − 1 A^{-1} A1的一列或两列。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值