矩阵的运算
矩阵的转置
转置:矩阵 A A A的行列互换得到的矩阵称为 A A A 的转置(transpose),记作 A T A^T AT。
性质:矩阵转置运算满足下列性质:
- ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
- ( A T ) T = A (A^T)^T=A (AT)T=A
- ( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT
- ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
- ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T
方阵的运算
三角矩阵:(triangular matrix)主对角线的下方元素都是零的方阵,称为上三角矩阵。类似的,主对角线的上方元素都是零的方阵,称为下三角矩阵。
[
a
11
a
12
⋯
a
1
n
a
22
⋯
a
2
n
⋱
⋮
a
n
n
]
,
[
a
11
a
21
a
22
⋮
⋮
⋱
a
n
1
a
n
2
⋯
a
n
n
]
\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ &a_{22}&\cdots&a_{2n} \\ &&\ddots&\vdots \\ &&&a_{nn} \\ \end{bmatrix},\quad \begin{bmatrix} a_{11}&&& \\ a_{21}&a_{22}&& \\ \vdots&\vdots&\ddots& \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{bmatrix}
a11a12a22⋯⋯⋱a1na2n⋮ann
,
a11a21⋮an1a22⋮an2⋱⋯ann
上(下)三角阵的行列式为主对角线元素的乘积
det
A
=
a
11
a
22
⋯
a
n
n
\det A=a_{11}a_{22}\cdots a_{nn}
detA=a11a22⋯ann
对角阵:不在主对角线上的元素全为零的矩阵称为对角阵(diagonal matrix),记作
d
i
a
g
(
a
1
,
a
2
,
⋯
,
a
n
)
=
[
a
1
a
2
⋱
a
n
]
\mathrm{diag}(a_1,a_2,\cdots,a_n)=\begin{bmatrix} a_1 \\ &a_2 \\ &&\ddots \\ &&&a_n \\ \end{bmatrix}
diag(a1,a2,⋯,an)=
a1a2⋱an
对角阵有良好的性质:
-
两对角阵的乘积仍为对角阵
[ a 1 a 2 ⋱ a n ] [ b 1 b 2 ⋱ b n ] = [ a 1 b 1 a 2 b 2 ⋱ a n b n ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix} \begin{bmatrix}b_1 \\&b_2 \\&&\ddots \\&&&b_n \end{bmatrix}= \begin{bmatrix}a_1b_1 \\&a_2b_2 \\&&\ddots \\&&&a_nb_n \end{bmatrix} a1a2⋱an b1b2⋱bn = a1b1a2b2⋱anbn -
对角阵的幂仍为对角阵
[ a 1 a 2 ⋱ a n ] k = [ a 1 k a 2 k ⋱ a n k ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix}^k= \begin{bmatrix}a_1^k \\&a_2^k \\&&\ddots \\&&&a_n^k \end{bmatrix} a1a2⋱an k= a1ka2k⋱ank
数量阵:主对角线上的元素都相等的对角阵,称为数量阵(scalar matrix)。
d
i
a
g
(
a
,
a
,
⋯
,
a
)
=
[
a
a
⋱
a
]
\mathrm{diag}(a,a,\cdots,a)=\begin{bmatrix} a \\ &a \\ &&\ddots \\ &&&a \\ \end{bmatrix}
diag(a,a,⋯,a)=
aa⋱a
数量阵得名于它的乘法。如二阶数量阵
[
k
0
0
k
]
A
=
k
[
1
0
0
1
]
A
=
k
A
\begin{bmatrix}k&0 \\ 0&k \end{bmatrix}A=k\begin{bmatrix}1&0 \\ 0&1 \end{bmatrix}A=kA
[k00k]A=k[1001]A=kA
单位阵:主对角线上的元素全为1的对角阵,称为单位阵(identity matrix)。
n
n
n 阶单位阵记作
E
n
E_n
En或
I
n
I_n
In。任何矩阵与单位阵的乘积都等于自身。
I
3
=
[
1
0
0
0
1
0
0
0
1
]
I_3=\begin{bmatrix}1&0&0 \\0&1&0 \\0&0&1 \\ \end{bmatrix}
I3=
100010001
对称阵与反对称阵:设
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij) 为
n
n
n阶方阵,若
A
T
=
A
A^T=A
AT=A ,即
a
i
j
=
a
j
i
a_{ij}=a_{ji}
aij=aji,则称为对称阵(symmetric matrix);若
A
T
=
−
A
A^T=-A
AT=−A ,即
a
i
j
=
−
a
j
i
a_{ij}=-a_{ji}
aij=−aji,则称为反对称阵(skew-symmetric matrix)。
易证明 A A T AA^T AAT 和 A T A A^TA ATA 是对称阵。
方阵的幂:由于矩阵满足结合律,我们可以定义矩阵的幂运算
A
0
=
I
,
A
n
=
A
A
⋯
A
⏞
n
A^0=I,\quad A^n=\overbrace{AA\cdots A}^n
A0=I,An=AA⋯A
n
当矩阵
A
A
A 可逆时,定义
A
−
k
=
(
A
−
1
)
k
A^{-k}=(A^{-1})^k
A−k=(A−1)k
显然只有方阵的幂才有意义。幂运算满足如下性质:
- A k A l = A k + l A^kA^l=A^{k+l} AkAl=Ak+l
- ( A k ) l = A k l (A^k)^l=A^{kl} (Ak)l=Akl
注意:因为矩阵乘法无交换率,因此一般情况下 ( A B ) k ≠ A k B k (AB)^k\neq A^kB^k (AB)k=AkBk
初等矩阵
初等变换:矩阵初等行变换的定义同样适用于列,相应的记法为 c i ↔ c j , k c i , c i + k c j c_i\lrarr c_j,kc_i,c_i+kc_j ci↔cj,kci,ci+kcj 。矩阵的初等行变换和初等列变换统称矩阵的初等变换。若矩阵 A A A 经有限次初等变换变为 B B B,则称 A A A与 B B B 等价(equivalent) 。
矩阵的初等变换是矩阵的一种最基本运算,其过程可以通过特殊矩阵的乘法来表示。
初等矩阵:由单位矩阵进行一次初等变换得到的矩阵称为初等矩阵(elementary matrix)。易知初等矩阵都是可逆的。
三种初等变换对应着三种初等矩阵。由矩阵的乘法运算可以验证:对矩阵的初等行变换相当于左乘相应的初等矩阵;对矩阵的初等列变换相当于右乘相应的初等矩阵。
-
互换变换,如 r 1 ↔ r 2 r_1\lrarr r_2 r1↔r2
[ 0 1 0 1 0 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 2 b 2 a 1 b 1 a 3 b 3 ] \begin{bmatrix}0&1&0 \\1&0&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_2&b_2\\a_1&b_1 \\a_3&b_3\end{bmatrix} 010100001 a1a2a3b1b2b3 = a2a1a3b2b1b3 -
倍乘变换,如 2 r 1 2r_1 2r1
[ 2 0 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ 2 a 1 b 1 a 2 b 2 a 3 b 3 ] \begin{bmatrix}2&0&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}2a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix} 200010001 a1a2a3b1b2b3 = 2a1a2a3b1b2b3 -
倍加变换,如 r 1 + 2 r 2 r_1+2r_2 r1+2r2
[ 1 2 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 1 + 2 a 2 b 1 + 2 b 2 a 2 b 2 a 3 b 3 ] \begin{bmatrix}1&2&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_1+2a_2&b_1+2b_2 \\a_2&b_2\\a_3&b_3\end{bmatrix} 100210001 a1a2a3b1b2b3 = a1+2a2a2a3b1+2b2b2b3
定理:任意一个可逆矩阵都可以表示为有限个初等矩阵的乘积。
由于初等矩阵可逆,所以初等矩阵的乘积亦可逆。
所有矩阵都可通过初等变换化为标准型
[
1
⋱
1
}
r
0
⋱
0
]
=
[
I
r
O
O
O
]
\begin{bmatrix} \left.\begin{matrix}1&& \\ &\ddots&\\&&1\end{matrix}\right\}r & \\ &\begin{matrix}0 \\ &\ddots&\\&&0\end{matrix} \end{bmatrix}= \begin{bmatrix}I_r&O \\O&O\end{bmatrix}
1⋱1⎭
⎬
⎫r0⋱0
=[IrOOO]
分块矩阵
分块矩阵是矩阵运算的一种技巧。
在矩阵的运算和理论研究中,有时对矩阵进行分块处理,常常会简化矩阵的运算,或者使原矩阵显得结构简单而清晰。
[
1
0
0
0
0
1
0
0
0
0
1
5
]
=
[
I
2
O
O
A
]
\begin{bmatrix} \begin{array}{cc:cc} 1&0 & 0 & 0 \\ 0&1 & 0 &0 \\ \hdashline 0&0 & 1 & 5 \end{array}\end{bmatrix} =\begin{bmatrix} I_2 & O \\ O & A \end{bmatrix}
100010001005
=[I2OOA]
像这样,结合矩阵本身的特点,把一个矩阵用横线和竖线划分为若干个子块,并以所分的子块为元素的矩阵称为分块矩阵(Block matrix)。一个矩阵可用不同的方法分块。
分块矩阵的运算形式上和普通矩阵相同,把子块当成元素计算即可。
加法:设分块
A
,
B
A,B
A,B 是同型矩阵,且对它们的分法相同,则
A
+
B
=
(
A
i
j
+
B
i
j
)
A+B=(A_{ij}+B_{ij})
A+B=(Aij+Bij)
[
A
1
B
1
C
1
D
1
]
+
[
A
2
B
2
C
2
D
2
]
=
[
A
1
+
A
2
B
1
+
B
2
C
1
+
C
2
D
1
+
D
2
]
\begin{bmatrix}A_1 & B_1 \\C_1 & D_1 \end{bmatrix}+ \begin{bmatrix}A_2 & B_2 \\C_2 & D_2 \end{bmatrix}=\begin{bmatrix}A_1+A_2 & B_1+B_2 \\C_1+C_2 & D_1+D_2 \end{bmatrix}
[A1C1B1D1]+[A2C2B2D2]=[A1+A2C1+C2B1+B2D1+D2]
数乘:分块矩阵
A
A
A ,数乘作用于每个子块。
k
[
A
B
C
D
]
=
[
k
A
k
B
k
C
k
D
]
k\begin{bmatrix}A & B \\C & D \end{bmatrix}=\begin{bmatrix}kA & kB \\kC & kD \end{bmatrix}
k[ACBD]=[kAkCkBkD]
乘法:分块矩阵的乘法按矩阵乘法的形式计算。
A
B
=
A
[
b
1
b
2
⋯
b
p
]
=
[
A
b
1
A
b
2
⋯
A
b
p
]
AB=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_p\end{bmatrix}= \begin{bmatrix}A\mathbf b_1&A\mathbf b_2&\cdots&A\mathbf b_p\end{bmatrix}
AB=A[b1b2⋯bp]=[Ab1Ab2⋯Abp]
矩阵乘法的列行展开
A
B
=
[
a
1
a
2
⋯
a
n
]
[
b
1
b
2
⋮
b
n
]
=
a
1
b
1
+
a
2
b
2
+
⋯
+
a
n
b
n
AB=\begin{bmatrix}\mathbf a_1&\mathbf a_2&\cdots&\mathbf a_n\end{bmatrix} \begin{bmatrix}\mathbf b_1\\\mathbf b_2\\\vdots\\\mathbf b_n\end{bmatrix} =\mathbf a_1\mathbf b_1+\mathbf a_2\mathbf b_2+\cdots+\mathbf a_n\mathbf b_n
AB=[a1a2⋯an]
b1b2⋮bn
=a1b1+a2b2+⋯+anbn
转置:分块矩阵
A
=
(
A
i
j
)
A=(A_{ij})
A=(Aij) 的转置等于各子块的转置
A
T
=
(
A
i
j
T
)
A^T=(A_{ij}^T)
AT=(AijT)
分块上三角矩阵:
[
A
B
O
D
]
−
1
=
[
A
−
1
−
A
−
1
B
D
−
1
O
D
−
1
]
\begin{bmatrix}A&B\\O&D\end{bmatrix}^{-1}= \begin{bmatrix}A^{-1}&-A^{-1}BD^{-1}\\O&D^{-1}\end{bmatrix}
[AOBD]−1=[A−1O−A−1BD−1D−1]
设分块矩阵
[
X
1
X
2
X
3
X
4
]
\begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix}
[X1X3X2X4] 是矩阵
[
A
B
O
D
]
\begin{bmatrix}A&B\\O&D\end{bmatrix}
[AOBD] 的逆,则
[
A
B
O
D
]
[
X
1
X
2
X
3
X
4
]
=
[
I
p
O
O
I
q
]
\begin{bmatrix}A&B\\O&D\end{bmatrix} \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} =\begin{bmatrix}I_p&O\\O&I_q\end{bmatrix}
[AOBD][X1X3X2X4]=[IpOOIq]
这个矩阵方程包含了4个未知子块的方程
A
X
1
+
B
X
3
=
I
p
A
X
2
+
B
X
4
=
O
D
X
3
=
O
D
X
4
=
I
q
AX_1+BX_3=I_p \\ AX_2+BX_4=O \\ DX_3=O \\ DX_4=I_q
AX1+BX3=IpAX2+BX4=ODX3=ODX4=Iq
若
D
D
D 可逆,从后两个方程可以得到
X
3
=
O
,
X
4
=
D
−
1
X_3=O,X_4=D^{-1}
X3=O,X4=D−1 ;若
A
A
A 可逆,进一步可以得到
X
1
=
A
−
1
,
X
2
=
−
A
−
1
B
D
−
1
X_1=A^{-1},X_2=-A^{-1}BD^{-1}
X1=A−1,X2=−A−1BD−1 。便可获得分块上三角矩阵的逆。
分块对角矩阵:分块对角矩阵拥有良好的性质。
(1) 分块对角矩阵乘积
[
A
1
A
2
⋱
A
s
]
[
B
1
B
2
⋱
B
s
]
=
[
A
1
B
1
A
2
B
2
⋱
A
s
B
s
]
\begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} \begin{bmatrix}B_1 \\&B_2 \\&&\ddots \\&&&B_s \end{bmatrix} =\begin{bmatrix}A_1B_1 \\&A_2B_2 \\&&\ddots \\&&&A_sB_s \end{bmatrix}
A1A2⋱As
B1B2⋱Bs
=
A1B1A2B2⋱AsBs
(2) 若分块对角矩阵的各个子块可逆,则该对角分块矩阵可逆
[
A
1
A
2
⋱
A
s
]
−
1
=
[
A
1
−
1
A
2
−
1
⋱
A
s
−
1
]
\begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix}^{-1}= \begin{bmatrix}A_1^{-1} \\&A_2^{-1} \\&&\ddots \\&&&A_s^{-1} \end{bmatrix}
A1A2⋱As
−1=
A1−1A2−1⋱As−1
(3) 分块对角矩阵的行列式为对角位置的行列式乘积
det
[
A
1
A
2
⋱
A
s
]
=
det
A
1
det
A
2
⋯
det
A
s
\det\begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} =\det A_1\det A_2\cdots\det A_s
det
A1A2⋱As
=detA1detA2⋯detAs
逆矩阵
利用克拉默法可以容易地导出一个求矩阵的逆的一般公式。设矩阵
A
=
(
a
i
j
)
n
×
n
A=(a_{ij})_{n\times n}
A=(aij)n×n 的逆矩阵
A
−
1
=
(
b
i
j
)
n
×
n
A^{-1}=(b_{ij})_{n\times n}
A−1=(bij)n×n ,利用分块矩阵的乘法
A
A
−
1
=
A
[
b
1
b
2
⋯
b
n
]
=
I
n
=
[
e
1
e
2
⋯
e
n
]
AA^{-1}=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_n\end{bmatrix} =I_n=\begin{bmatrix}\mathbf e_1&\mathbf e_2&\cdots&\mathbf e_n\end{bmatrix}
AA−1=A[b1b2⋯bn]=In=[e1e2⋯en]
其中
b
j
\mathbf b_j
bj 是矩阵
A
−
1
A^{-1}
A−1 的第
j
j
j 列,
e
j
\mathbf e_j
ej 是单位阵
I
n
I_n
In 的第
j
j
j 列。于是
A
b
j
=
e
j
A\mathbf b_j=\mathbf e_j
Abj=ej
向量
b
j
\mathbf b_j
bj 的第
i
i
i 个元素是
A
−
1
A^{-1}
A−1 的元素
b
i
j
b_{ij}
bij 。由克拉默法则求得
b
i
j
=
det
A
i
(
e
j
)
det
A
b_{ij}=\frac{\det A_i(\mathbf e_j)}{\det A}
bij=detAdetAi(ej)
回顾代数余子式的定义,它是把矩阵
A
A
A 中元素
a
i
j
a_{ij}
aij 所在的行和列划掉后得到的。
det
A
i
(
e
j
)
\det A_i(\mathbf e_j)
detAi(ej) 按第
i
i
i 列的余子展开式为
det
A
i
(
e
j
)
=
(
−
1
)
i
+
j
M
j
i
=
A
j
i
\det A_i(\mathbf e_j)=(-1)^{i+j}M_{ji}=A_{ji}
detAi(ej)=(−1)i+jMji=Aji
于是可写出矩阵
A
A
A 的逆
A
−
1
=
1
det
A
adj
A
A^{-1}=\dfrac{1}{\det A}\text{adj }A
A−1=detA1adj A
其中
adj
A
\text{adj }A
adj A 是矩阵
A
A
A 的各个元素的代数余子式
A
j
i
A_{ji}
Aji 所构成的矩阵
adj
A
=
[
A
11
A
21
⋯
A
n
1
A
12
A
22
⋯
A
n
2
⋮
⋮
⋱
⋮
A
1
n
A
2
n
⋯
A
n
n
]
\text{adj }A=\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{bmatrix}
adj A=
A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann
做矩阵
A
A
A的伴随矩阵(Adjugate Matrix) 。
注意,伴随矩阵里代数余子式的排列顺序是颠倒的。
定理:方阵 A A A 可逆的充要条件是 det A ≠ 0 \det A\neq0 detA=0 ,且 A − 1 = 1 det A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A
此定理仅适用于理论上的计算矩阵的逆,使我们不用实际计算出 A − 1 A^{-1} A−1 就可以推导出性质。
这里给出二阶方阵
A
=
[
a
b
c
d
]
A=\begin{bmatrix}a&b\\c&d\end{bmatrix}
A=[acbd] 的逆,若
det
A
=
a
d
−
b
c
≠
0
\det A=ad-bc\neq0
detA=ad−bc=0 则
A
−
1
=
1
a
d
−
b
c
[
d
−
b
−
c
a
]
A^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix}
A−1=ad−bc1[d−c−ba]
推论:
- 若 n n n 阶方阵 A , B A,B A,B 满足 A B = I AB=I AB=I 或 B A = I BA=I BA=I ,则 B = A − 1 B=A^{-1} B=A−1 。
- A ( adj A ) = ( adj A ) A = ( det A ) I A(\text{adj }A)=(\text{adj }A)A=(\det A)I A(adj A)=(adj A)A=(detA)I
有了推论1,只需判断 A B = I AB=I AB=I 或 B A = I BA=I BA=I 中的一个条件就可判定逆矩阵,要比定义简单一些。
利用初等变换计算逆矩阵:写出增广矩阵
(
A
∣
I
)
(A\mid I)
(A∣I), 用初等行变换把左边矩阵
A
A
A 处化为单位矩阵
I
I
I ,则右边出来的就是逆矩阵
A
−
1
A^{-1}
A−1,示意如下:
(
A
∣
I
)
→
(
I
∣
A
−
1
)
(A\mid I)\xrightarrow{}(I\mid A^{-1})
(A∣I)(I∣A−1)
同样,利用初等列变换计算逆矩阵的示意如下
[
A
I
]
→
[
I
A
−
1
]
\begin{bmatrix}A\\I\end{bmatrix}\xrightarrow{}\begin{bmatrix}I\\A^{-1}\end{bmatrix}
[AI][IA−1]
示例:解矩阵方程
[
1
0
1
−
1
1
1
2
−
1
1
]
[
x
1
y
1
x
2
y
2
x
3
y
3
]
=
[
1
1
0
1
−
1
0
]
\begin{bmatrix}1&0&1\\-1&1&1\\2&-1&1\end{bmatrix} \begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\\\end{bmatrix}= \begin{bmatrix}1&1\\0&1\\-1&0\\\end{bmatrix}
1−1201−1111
x1x2x3y1y2y3
=
10−1110
解:系数矩阵可逆的矩阵方程
A
X
=
B
AX=B
AX=B ,解为
X
=
A
−
1
B
X=A^{-1}B
X=A−1B 。实际中,不必求逆矩阵,可使用一系列初等变换求解,即系数矩阵和常数项做同样的变换
P
=
A
−
1
P=A^{-1}
P=A−1。图示如下
(
A
∣
B
)
→
(
I
∣
X
)
(A\mid B)\xrightarrow{}(I\mid X)
(A∣B)(I∣X)
本例计算过程如下
[
1
0
1
1
1
−
1
1
1
0
1
2
−
1
1
−
1
0
]
→
[
1
0
0
3
1
0
1
0
5
2
0
0
1
−
2
0
]
\begin{bmatrix} \begin{array}{ccc:cc} 1&0&1&1&1\\ -1&1&1&0&1\\ 2&-1&1&-1&0 \end{array} \end{bmatrix}\to \begin{bmatrix} \begin{array}{ccc:cc} 1&0&0&3&1\\ 0&1&0&5&2\\ 0&0&1&-2&0 \end{array} \end{bmatrix}
1−1201−111110−1110
→
10001000135−2120
故
[
x
1
y
1
x
2
y
2
x
3
y
3
]
=
[
3
1
5
2
−
2
0
]
\begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\end{bmatrix}= \begin{bmatrix}3&1\\5&2\\-2&0\end{bmatrix}
x1x2x3y1y2y3
=
35−2120
矩阵的秩
行空间:矩阵
A
=
(
r
1
,
r
2
,
⋯
,
r
m
)
T
A=(\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m)^T
A=(r1,r2,⋯,rm)T 的所有行向量张成的空间称为
A
A
A 的行空间,记为
row
A
=
span
{
r
1
,
r
2
,
⋯
,
r
m
}
\text{row }A=\text{span}\{\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m\}
row A=span{r1,r2,⋯,rm}
若两个矩阵
A
A
A 和
B
B
B 行等价,则它们的的行空间相同。若
B
B
B 是阶梯型矩阵,则
B
B
B 的非零行构成
row
B
\text{row }B
row B 的一组基,同时也是
row
A
\text{row }A
row A 的一组基。
证明:若 B B B 是由 A A A 经行变换得到的,则 B B B 的行是 A A A 的行的线性组合,于是 B B B 的行的任意线性组合自然是 A A A 的行的线性组合,从而 B B B 的行空间包含于 A A A 的行空间。因为行变换可逆,同理知 A A A 的行空间是 B B B 的行空间的子集,从而这两个空间相同。若 B B B 是一个阶梯形矩阵,则其非零行是线性无关的,这是因为任何一个非零行均不为它下面的非零行的线性组合,于是 B B B 的非零行构成 B B B 的行空间的一组基,当然也是 A A A 的行空间的一组基。
例:分别求矩阵
A
A
A 的行空间、列空间和零空间的基
A
=
[
−
2
−
5
8
0
−
17
1
3
−
5
1
5
3
11
−
19
7
1
1
7
−
13
5
−
3
]
A=\begin{bmatrix}-2&-5&8&0&-17\\1&3&-5&1&5\\3&11&-19&7&1\\1&7&-13&5&-3\end{bmatrix}
A=
−2131−531178−5−19−130175−1751−3
解:为了求行空间和列空间的基,行化简
A
A
A成阶梯形
A
→
[
1
3
−
5
1
5
0
1
−
2
2
−
7
0
0
0
−
4
20
0
0
0
0
0
]
=
B
A\to \begin{bmatrix}1&3&-5&1&5\\0&1&-2&2&-7\\0&0&0&-4&20\\0&0&0&0&0\end{bmatrix}=B
A→
10003100−5−20012−405−7200
=B
矩阵
B
B
B 的前 3 行构成
B
B
B的行空间的一个基,也是
A
A
A的行空间的一组基。
row A \text{row }A row A 的基: ( 1 , 3 , − 5 , 1 , 5 ) , ( 0 , 1 , − 2 , 2 , − 7 ) , ( 0 , 0 , 0 , − 4 , 20 ) (1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20) (1,3,−5,1,5),(0,1,−2,2,−7),(0,0,0,−4,20)
对列空间, B B B 的主元列在第1,2和4列,从而 A A A 的第1,2和4列构成 col A \text{col }A col A 的一组基。
col A \text{col }A col A 的基: ( − 2 , 1 , 3 , 1 ) T , ( − 5 , 3 , 11 , 7 ) T , ( 0 , 1 , 7 , 5 ) T (-2,1,3,1)^T,(-5,3,11,7)^T,(0,1,7,5)^T (−2,1,3,1)T,(−5,3,11,7)T,(0,1,7,5)T
对于核空间,需要进一步行变换得简化阶梯型矩阵
B
→
[
1
0
1
0
1
0
1
−
2
0
3
0
0
0
1
−
5
0
0
0
0
0
]
=
C
B\to\begin{bmatrix}1&0&1&0&1\\0&1&-2&0&3\\0&0&0&1&-5\\0&0&0&0&0\end{bmatrix}=C
B→
100001001−200001013−50
=C
方程
A
x
=
0
A\mathbf x=0
Ax=0 的解空间等价于
C
x
=
0
C\mathbf x=0
Cx=0 的解空间,即
{
x
1
+
x
3
+
x
5
=
0
x
2
−
2
x
3
+
3
x
5
=
0
x
4
−
5
x
5
=
0
\begin{cases} x_1+x_3+x_5=0 \\ x_2-2x_3+3x_5=0 \\ x_4-5x_5=0 \end{cases}
⎩
⎨
⎧x1+x3+x5=0x2−2x3+3x5=0x4−5x5=0
所以
[
x
1
x
2
x
3
x
4
x
5
]
=
x
3
[
−
1
2
1
0
0
]
+
x
5
[
−
1
−
3
0
5
1
]
\begin{bmatrix}x_1\\x_2\\x_3\\x_4\\x_5\end{bmatrix}= x_3\begin{bmatrix}-1\\2\\1\\0\\0\end{bmatrix}+ x_5\begin{bmatrix}-1\\-3\\0\\5\\1\end{bmatrix}
x1x2x3x4x5
=x3
−12100
+x5
−1−3051
ker
A
\ker A
kerA 的基:
(
−
1
,
2
,
1
,
0
,
0
)
T
,
(
−
1
,
−
3
,
0
,
5
,
1
)
T
(-1,2,1,0,0)^T,(-1,-3,0,5,1)^T
(−1,2,1,0,0)T,(−1,−3,0,5,1)T
通过观察可见,与 col A \text{col }A col A 的基不同, row A \text{row }A row A 和 ker A \ker A kerA 的基与 A A A 中的元素没有直接的关系。
定理:对于 m × n m\times n m×n 维矩阵 A A A
- dim ( row A ) = dim ( col A ) = rank A \dim(\text{row }A)=\dim(\text{col }A)=\text{rank }A dim(row A)=dim(col A)=rank A
- rank A + dim ( ker A ) = n \text{rank }A+\dim(\ker A)=n rank A+dim(kerA)=n
证明: rank A \text{rank }A rank A 是 A A A中主元列的个数,也是 A A A的等价阶梯形矩阵 B B B中主元列的个数。进一步,因为 B B B 的每个主元都对应一个非零行,同时这些非零行构成 A A A 的行空间的一组基,所以 A A A 的秩等于 row A \text{row }A row A 的维数。由于 ker A \ker A kerA 的维数等于方程 A x = 0 A\mathbf x=0 Ax=0 中自由变量的个数,换句话说, ker A \ker A kerA 的维数是 A A A 中非主元列的个数。上面的定理证闭。
性质:
- 矩阵的秩在初等变换下保持不变
- 矩阵的列向量组的秩等于行向量组的秩
- rank ( A + B ) ⩽ rank ( A ) + rank ( B ) \text{rank}(A+B)\leqslant \text{rank}(A)+\text{rank}(B) rank(A+B)⩽rank(A)+rank(B)
- rank ( k A ) = rank ( A ) \text{rank}(kA)=\text{rank}(A) rank(kA)=rank(A)
- rank ( A B ) ⩽ min { rank ( A ) , rank ( B ) } \text{rank}(AB)\leqslant \min\{\text{rank}(A),\text{rank}(B)\} rank(AB)⩽min{rank(A),rank(B)}
广义逆矩阵
对于非其次线性方程组 A x = b A\mathbf x=\mathbf b Ax=b ,当 A A A 可逆时,则方程组存在唯一解 x = A − 1 b \mathbf x=A^{-1}\mathbf b x=A−1b,通常矩阵 A A A 是任意的 m × n m\times n m×n 矩阵,不可逆的,这就促使人们去推广逆矩阵的概念,引进某种具有普通逆矩阵类似性质的矩阵 G G G,使得方程组的解仍可表示为 x = G b \mathbf x=G\mathbf b x=Gb 这种简单的形式。
- 若 A G A = A AGA=A AGA=A,则 A x = A G A x = A ( G b ) = b A\mathbf x=AGA\mathbf x=A(G\mathbf b)=\mathbf b Ax=AGAx=A(Gb)=b,于是 G b G\mathbf b Gb 是方程的解;
- 若 G A G = G GAG=G GAG=G,由于 G A x = G b GA\mathbf x=G\mathbf b GAx=Gb,所以 G A x = G A G A x = G A ( G b ) = G b GA\mathbf x=GAGA\mathbf x=GA(G\mathbf b)=G\mathbf b GAx=GAGAx=GA(Gb)=Gb,于是 G b G\mathbf b Gb 是方程的解;
对于
m
×
n
m\times n
m×n 维矩阵
A
A
A,若存在
n
×
m
n\times m
n×m 维矩阵
G
G
G 满足以下 M-P 方程
(1)
A
G
A
=
A
AGA=A
AGA=A
(2)
G
A
G
=
G
GAG=G
GAG=G
(3)
(
A
G
)
T
=
A
G
(AG)^T=AG
(AG)T=AG
(4)
(
G
A
)
T
=
G
A
(GA)^T=GA
(GA)T=GA
的全部或一部分,则称 G G G 为 A A A 的一个广义逆矩阵。若 G G G 满足全部 M-P 方程,则称 G G G 为 A A A 的 Moore-Penrose 广义逆矩阵,简称M-P 广义逆矩阵,也称为伪逆矩阵,记为 A + A^+ A+。事实上,只有伪逆矩阵存在且唯一,其他各类广义逆矩阵都不唯一。
性质:
- ( A + ) + = A (A^+)^+=A (A+)+=A
- ( A T ) + = ( A + ) T (A^T)^+=(A^+)^T (AT)+=(A+)T
- rank A + = rank A \text{rank }A^+=\text{rank }A rank A+=rank A
若非其次线性方程组
A
x
=
b
A\mathbf x=\mathbf b
Ax=b 有解,则解为
x
=
A
+
b
+
(
I
−
A
+
A
)
c
\mathbf x=A^+\mathbf b+(I-A^+A)\mathbf c
x=A+b+(I−A+A)c
其中
c
\mathbf c
c 是维数与
x
\mathbf x
x 的维数相同的任意向量。显然,当
A
A
A 可逆时,
x
=
A
−
1
b
+
(
I
−
A
−
1
A
)
c
=
A
−
1
b
\mathbf x=A^{-1}\mathbf b+(I-A^{-1}A)\mathbf c=A^{-1}\mathbf b
x=A−1b+(I−A−1A)c=A−1b 。
求伪逆矩阵的一个方法是利用奇异值分解
A
=
U
Σ
V
T
A=U\Sigma V^T
A=UΣVT 。由于
Λ
r
\Lambda_r
Λr 的对角线元素非零,所以
Λ
r
\Lambda_r
Λr 可逆,可求得伪逆为
A
+
=
V
r
Λ
r
−
1
U
r
T
A^+=V_r\Lambda_r^{-1} U^T_r
A+=VrΛr−1UrT