线性代数的本质(五)——矩阵的运算

矩阵的运算

矩阵的转置

转置:矩阵 A A A的行列互换得到的矩阵称为 A A A 的转置(transpose),记作 A T A^T AT

性质:矩阵转置运算满足下列性质:

  1. ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
  2. ( A T ) T = A (A^T)^T=A (AT)T=A
  3. ( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT
  4. ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
  5. ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)1=(A1)T

方阵的运算

三角矩阵:(triangular matrix)主对角线的下方元素都是零的方阵,称为上三角矩阵。类似的,主对角线的上方元素都是零的方阵,称为下三角矩阵
[ a 11 a 12 ⋯ a 1 n a 22 ⋯ a 2 n ⋱ ⋮ a n n ] , [ a 11 a 21 a 22 ⋮ ⋮ ⋱ a n 1 a n 2 ⋯ a n n ] \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ &a_{22}&\cdots&a_{2n} \\ &&\ddots&\vdots \\ &&&a_{nn} \\ \end{bmatrix},\quad \begin{bmatrix} a_{11}&&& \\ a_{21}&a_{22}&& \\ \vdots&\vdots&\ddots& \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{bmatrix} a11a12a22a1na2nann , a11a21an1a22an2ann

上(下)三角阵的行列式为主对角线元素的乘积
det ⁡ A = a 11 a 22 ⋯ a n n \det A=a_{11}a_{22}\cdots a_{nn} detA=a11a22ann
对角阵:不在主对角线上的元素全为零的矩阵称为对角阵(diagonal matrix),记作
d i a g ( a 1 , a 2 , ⋯   , a n ) = [ a 1 a 2 ⋱ a n ] \mathrm{diag}(a_1,a_2,\cdots,a_n)=\begin{bmatrix} a_1 \\ &a_2 \\ &&\ddots \\ &&&a_n \\ \end{bmatrix} diag(a1,a2,,an)= a1a2an
对角阵有良好的性质:

  1. 两对角阵的乘积仍为对角阵
    [ a 1 a 2 ⋱ a n ] [ b 1 b 2 ⋱ b n ] = [ a 1 b 1 a 2 b 2 ⋱ a n b n ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix} \begin{bmatrix}b_1 \\&b_2 \\&&\ddots \\&&&b_n \end{bmatrix}= \begin{bmatrix}a_1b_1 \\&a_2b_2 \\&&\ddots \\&&&a_nb_n \end{bmatrix} a1a2an b1b2bn = a1b1a2b2anbn

  2. 对角阵的幂仍为对角阵
    [ a 1 a 2 ⋱ a n ] k = [ a 1 k a 2 k ⋱ a n k ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix}^k= \begin{bmatrix}a_1^k \\&a_2^k \\&&\ddots \\&&&a_n^k \end{bmatrix} a1a2an k= a1ka2kank

数量阵:主对角线上的元素都相等的对角阵,称为数量阵(scalar matrix)。
d i a g ( a , a , ⋯   , a ) = [ a a ⋱ a ] \mathrm{diag}(a,a,\cdots,a)=\begin{bmatrix} a \\ &a \\ &&\ddots \\ &&&a \\ \end{bmatrix} diag(a,a,,a)= aaa
数量阵得名于它的乘法。如二阶数量阵
[ k 0 0 k ] A = k [ 1 0 0 1 ] A = k A \begin{bmatrix}k&0 \\ 0&k \end{bmatrix}A=k\begin{bmatrix}1&0 \\ 0&1 \end{bmatrix}A=kA [k00k]A=k[1001]A=kA

单位阵:主对角线上的元素全为1的对角阵,称为单位阵(identity matrix)。 n n n 阶单位阵记作 E n E_n En I n I_n In。任何矩阵与单位阵的乘积都等于自身。
I 3 = [ 1 0 0 0 1 0 0 0 1 ] I_3=\begin{bmatrix}1&0&0 \\0&1&0 \\0&0&1 \\ \end{bmatrix} I3= 100010001
对称阵反对称阵:设 A = ( a i j ) A=(a_{ij}) A=(aij) n n n阶方阵,若 A T = A A^T=A AT=A ,即 a i j = a j i a_{ij}=a_{ji} aij=aji,则称为对称阵(symmetric matrix);若 A T = − A A^T=-A AT=A ,即 a i j = − a j i a_{ij}=-a_{ji} aij=aji,则称为反对称阵(skew-symmetric matrix)。

易证明 A A T AA^T AAT A T A A^TA ATA 是对称阵。

方阵的幂:由于矩阵满足结合律,我们可以定义矩阵的幂运算
A 0 = I , A n = A A ⋯ A ⏞ n A^0=I,\quad A^n=\overbrace{AA\cdots A}^n A0=I,An=AAA n
当矩阵 A A A 可逆时,定义
A − k = ( A − 1 ) k A^{-k}=(A^{-1})^k Ak=(A1)k
显然只有方阵的幂才有意义。幂运算满足如下性质:

  1. A k A l = A k + l A^kA^l=A^{k+l} AkAl=Ak+l
  2. ( A k ) l = A k l (A^k)^l=A^{kl} (Ak)l=Akl

注意:因为矩阵乘法无交换率,因此一般情况下 ( A B ) k ≠ A k B k (AB)^k\neq A^kB^k (AB)k=AkBk

初等矩阵

初等变换:矩阵初等行变换的定义同样适用于列,相应的记法为 c i ↔ c j , k c i , c i + k c j c_i\lrarr c_j,kc_i,c_i+kc_j cicj,kci,ci+kcj 。矩阵的初等行变换和初等列变换统称矩阵的初等变换。若矩阵 A A A 经有限次初等变换变为 B B B,则称 A A A B B B 等价(equivalent) 。

矩阵的初等变换是矩阵的一种最基本运算,其过程可以通过特殊矩阵的乘法来表示。

初等矩阵:由单位矩阵进行一次初等变换得到的矩阵称为初等矩阵(elementary matrix)。易知初等矩阵都是可逆的。

三种初等变换对应着三种初等矩阵。由矩阵的乘法运算可以验证:对矩阵的初等行变换相当于左乘相应的初等矩阵;对矩阵的初等列变换相当于右乘相应的初等矩阵

  1. 互换变换,如 r 1 ↔ r 2 r_1\lrarr r_2 r1r2
    [ 0 1 0 1 0 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 2 b 2 a 1 b 1 a 3 b 3 ] \begin{bmatrix}0&1&0 \\1&0&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_2&b_2\\a_1&b_1 \\a_3&b_3\end{bmatrix} 010100001 a1a2a3b1b2b3 = a2a1a3b2b1b3

  2. 倍乘变换,如 2 r 1 2r_1 2r1
    [ 2 0 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ 2 a 1 b 1 a 2 b 2 a 3 b 3 ] \begin{bmatrix}2&0&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}2a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix} 200010001 a1a2a3b1b2b3 = 2a1a2a3b1b2b3

  3. 倍加变换,如 r 1 + 2 r 2 r_1+2r_2 r1+2r2
    [ 1 2 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 1 + 2 a 2 b 1 + 2 b 2 a 2 b 2 a 3 b 3 ] \begin{bmatrix}1&2&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_1+2a_2&b_1+2b_2 \\a_2&b_2\\a_3&b_3\end{bmatrix} 100210001 a1a2a3b1b2b3 = a1+2a2a2a3b1+2b2b2b3

定理:任意一个可逆矩阵都可以表示为有限个初等矩阵的乘积。

由于初等矩阵可逆,所以初等矩阵的乘积亦可逆。

所有矩阵都可通过初等变换化为标准型
[ 1 ⋱ 1 } r 0 ⋱ 0 ] = [ I r O O O ] \begin{bmatrix} \left.\begin{matrix}1&& \\ &\ddots&\\&&1\end{matrix}\right\}r & \\ &\begin{matrix}0 \\ &\ddots&\\&&0\end{matrix} \end{bmatrix}= \begin{bmatrix}I_r&O \\O&O\end{bmatrix} 11 r00 =[IrOOO]

分块矩阵

分块矩阵是矩阵运算的一种技巧。

在矩阵的运算和理论研究中,有时对矩阵进行分块处理,常常会简化矩阵的运算,或者使原矩阵显得结构简单而清晰。
[ 1 0 0 0 0 1 0 0 0 0 1 5 ] = [ I 2 O O A ] \begin{bmatrix} \begin{array}{cc:cc} 1&0 & 0 & 0 \\ 0&1 & 0 &0 \\ \hdashline 0&0 & 1 & 5 \end{array}\end{bmatrix} =\begin{bmatrix} I_2 & O \\ O & A \end{bmatrix} 100010001005 =[I2OOA]
像这样,结合矩阵本身的特点,把一个矩阵用横线和竖线划分为若干个子块,并以所分的子块为元素的矩阵称为分块矩阵(Block matrix)。一个矩阵可用不同的方法分块。

分块矩阵的运算形式上和普通矩阵相同,把子块当成元素计算即可。

加法:设分块 A , B A,B A,B 是同型矩阵,且对它们的分法相同,则 A + B = ( A i j + B i j ) A+B=(A_{ij}+B_{ij}) A+B=(Aij+Bij)
[ A 1 B 1 C 1 D 1 ] + [ A 2 B 2 C 2 D 2 ] = [ A 1 + A 2 B 1 + B 2 C 1 + C 2 D 1 + D 2 ] \begin{bmatrix}A_1 & B_1 \\C_1 & D_1 \end{bmatrix}+ \begin{bmatrix}A_2 & B_2 \\C_2 & D_2 \end{bmatrix}=\begin{bmatrix}A_1+A_2 & B_1+B_2 \\C_1+C_2 & D_1+D_2 \end{bmatrix} [A1C1B1D1]+[A2C2B2D2]=[A1+A2C1+C2B1+B2D1+D2]
数乘:分块矩阵 A A A ,数乘作用于每个子块。
k [ A B C D ] = [ k A k B k C k D ] k\begin{bmatrix}A & B \\C & D \end{bmatrix}=\begin{bmatrix}kA & kB \\kC & kD \end{bmatrix} k[ACBD]=[kAkCkBkD]
乘法:分块矩阵的乘法按矩阵乘法的形式计算。
A B = A [ b 1 b 2 ⋯ b p ] = [ A b 1 A b 2 ⋯ A b p ] AB=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_p\end{bmatrix}= \begin{bmatrix}A\mathbf b_1&A\mathbf b_2&\cdots&A\mathbf b_p\end{bmatrix} AB=A[b1b2bp]=[Ab1Ab2Abp]
矩阵乘法的列行展开
A B = [ a 1 a 2 ⋯ a n ] [ b 1 b 2 ⋮ b n ] = a 1 b 1 + a 2 b 2 + ⋯ + a n b n AB=\begin{bmatrix}\mathbf a_1&\mathbf a_2&\cdots&\mathbf a_n\end{bmatrix} \begin{bmatrix}\mathbf b_1\\\mathbf b_2\\\vdots\\\mathbf b_n\end{bmatrix} =\mathbf a_1\mathbf b_1+\mathbf a_2\mathbf b_2+\cdots+\mathbf a_n\mathbf b_n AB=[a1a2an] b1b2bn =a1b1+a2b2++anbn
转置:分块矩阵 A = ( A i j ) A=(A_{ij}) A=(Aij) 的转置等于各子块的转置 A T = ( A i j T ) A^T=(A_{ij}^T) AT=(AijT)

分块上三角矩阵
[ A B O D ] − 1 = [ A − 1 − A − 1 B D − 1 O D − 1 ] \begin{bmatrix}A&B\\O&D\end{bmatrix}^{-1}= \begin{bmatrix}A^{-1}&-A^{-1}BD^{-1}\\O&D^{-1}\end{bmatrix} [AOBD]1=[A1OA1BD1D1]
设分块矩阵 [ X 1 X 2 X 3 X 4 ] \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} [X1X3X2X4] 是矩阵 [ A B O D ] \begin{bmatrix}A&B\\O&D\end{bmatrix} [AOBD] 的逆,则
[ A B O D ] [ X 1 X 2 X 3 X 4 ] = [ I p O O I q ] \begin{bmatrix}A&B\\O&D\end{bmatrix} \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} =\begin{bmatrix}I_p&O\\O&I_q\end{bmatrix} [AOBD][X1X3X2X4]=[IpOOIq]
这个矩阵方程包含了4个未知子块的方程
A X 1 + B X 3 = I p A X 2 + B X 4 = O D X 3 = O D X 4 = I q AX_1+BX_3=I_p \\ AX_2+BX_4=O \\ DX_3=O \\ DX_4=I_q AX1+BX3=IpAX2+BX4=ODX3=ODX4=Iq
D D D 可逆,从后两个方程可以得到 X 3 = O , X 4 = D − 1 X_3=O,X_4=D^{-1} X3=O,X4=D1 ;若 A A A 可逆,进一步可以得到 X 1 = A − 1 , X 2 = − A − 1 B D − 1 X_1=A^{-1},X_2=-A^{-1}BD^{-1} X1=A1,X2=A1BD1 。便可获得分块上三角矩阵的逆。

分块对角矩阵:分块对角矩阵拥有良好的性质。

(1) 分块对角矩阵乘积
[ A 1 A 2 ⋱ A s ] [ B 1 B 2 ⋱ B s ] = [ A 1 B 1 A 2 B 2 ⋱ A s B s ] \begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} \begin{bmatrix}B_1 \\&B_2 \\&&\ddots \\&&&B_s \end{bmatrix} =\begin{bmatrix}A_1B_1 \\&A_2B_2 \\&&\ddots \\&&&A_sB_s \end{bmatrix} A1A2As B1B2Bs = A1B1A2B2AsBs
(2) 若分块对角矩阵的各个子块可逆,则该对角分块矩阵可逆
[ A 1 A 2 ⋱ A s ] − 1 = [ A 1 − 1 A 2 − 1 ⋱ A s − 1 ] \begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix}^{-1}= \begin{bmatrix}A_1^{-1} \\&A_2^{-1} \\&&\ddots \\&&&A_s^{-1} \end{bmatrix} A1A2As 1= A11A21As1
(3) 分块对角矩阵的行列式为对角位置的行列式乘积
det ⁡ [ A 1 A 2 ⋱ A s ] = det ⁡ A 1 det ⁡ A 2 ⋯ det ⁡ A s \det\begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} =\det A_1\det A_2\cdots\det A_s det A1A2As =detA1detA2detAs

逆矩阵

利用克拉默法可以容易地导出一个求矩阵的逆的一般公式。设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n 的逆矩阵 A − 1 = ( b i j ) n × n A^{-1}=(b_{ij})_{n\times n} A1=(bij)n×n ,利用分块矩阵的乘法
A A − 1 = A [ b 1 b 2 ⋯ b n ] = I n = [ e 1 e 2 ⋯ e n ] AA^{-1}=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_n\end{bmatrix} =I_n=\begin{bmatrix}\mathbf e_1&\mathbf e_2&\cdots&\mathbf e_n\end{bmatrix} AA1=A[b1b2bn]=In=[e1e2en]
其中 b j \mathbf b_j bj 是矩阵 A − 1 A^{-1} A1 的第 j j j 列, e j \mathbf e_j ej 是单位阵 I n I_n In 的第 j j j 列。于是
A b j = e j A\mathbf b_j=\mathbf e_j Abj=ej
向量 b j \mathbf b_j bj 的第 i i i 个元素是 A − 1 A^{-1} A1 的元素 b i j b_{ij} bij 。由克拉默法则求得
b i j = det ⁡ A i ( e j ) det ⁡ A b_{ij}=\frac{\det A_i(\mathbf e_j)}{\det A} bij=detAdetAi(ej)
回顾代数余子式的定义,它是把矩阵 A A A 中元素 a i j a_{ij} aij 所在的行和列划掉后得到的。 det ⁡ A i ( e j ) \det A_i(\mathbf e_j) detAi(ej) 按第 i i i 列的余子展开式为
det ⁡ A i ( e j ) = ( − 1 ) i + j M j i = A j i \det A_i(\mathbf e_j)=(-1)^{i+j}M_{ji}=A_{ji} detAi(ej)=(1)i+jMji=Aji
于是可写出矩阵 A A A 的逆
A − 1 = 1 det ⁡ A adj  A A^{-1}=\dfrac{1}{\det A}\text{adj }A A1=detA1adj A
其中 adj  A \text{adj }A adj A 是矩阵 A A A 的各个元素的代数余子式 A j i A_{ji} Aji 所构成的矩阵
adj  A = [ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ] \text{adj }A=\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{bmatrix} adj A= A11A12A1nA21A22A2nAn1An2Ann
做矩阵 A A A伴随矩阵(Adjugate Matrix) 。

注意,伴随矩阵里代数余子式的排列顺序是颠倒的。

定理:方阵 A A A 可逆的充要条件是 det ⁡ A ≠ 0 \det A\neq0 detA=0 ,且 A − 1 = 1 det ⁡ A adj  A A^{-1}=\dfrac{1}{\det A}\text{adj }A A1=detA1adj A

此定理仅适用于理论上的计算矩阵的逆,使我们不用实际计算出 A − 1 A^{-1} A1 就可以推导出性质。

这里给出二阶方阵 A = [ a b c d ] A=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆,若 det ⁡ A = a d − b c ≠ 0 \det A=ad-bc\neq0 detA=adbc=0
A − 1 = 1 a d − b c [ d − b − c a ] A^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A1=adbc1[dcba]

推论

  1. n n n 阶方阵 A , B A,B A,B 满足 A B = I AB=I AB=I B A = I BA=I BA=I ,则 B = A − 1 B=A^{-1} B=A1
  2. A ( adj  A ) = ( adj  A ) A = ( det ⁡ A ) I A(\text{adj }A)=(\text{adj }A)A=(\det A)I A(adj A)=(adj A)A=(detA)I

有了推论1,只需判断 A B = I AB=I AB=I B A = I BA=I BA=I 中的一个条件就可判定逆矩阵,要比定义简单一些。

利用初等变换计算逆矩阵:写出增广矩阵 ( A ∣ I ) (A\mid I) (AI), 用初等行变换把左边矩阵 A A A 处化为单位矩阵 I I I ,则右边出来的就是逆矩阵 A − 1 A^{-1} A1,示意如下:
( A ∣ I ) → ( I ∣ A − 1 ) (A\mid I)\xrightarrow{}(I\mid A^{-1}) (AI) (IA1)

同样,利用初等列变换计算逆矩阵的示意如下
[ A I ] → [ I A − 1 ] \begin{bmatrix}A\\I\end{bmatrix}\xrightarrow{}\begin{bmatrix}I\\A^{-1}\end{bmatrix} [AI] [IA1]

示例:解矩阵方程
[ 1 0 1 − 1 1 1 2 − 1 1 ] [ x 1 y 1 x 2 y 2 x 3 y 3 ] = [ 1 1 0 1 − 1 0 ] \begin{bmatrix}1&0&1\\-1&1&1\\2&-1&1\end{bmatrix} \begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\\\end{bmatrix}= \begin{bmatrix}1&1\\0&1\\-1&0\\\end{bmatrix} 112011111 x1x2x3y1y2y3 = 101110
解:系数矩阵可逆的矩阵方程 A X = B AX=B AX=B ,解为 X = A − 1 B X=A^{-1}B X=A1B 。实际中,不必求逆矩阵,可使用一系列初等变换求解,即系数矩阵和常数项做同样的变换 P = A − 1 P=A^{-1} P=A1。图示如下
( A ∣ B ) → ( I ∣ X ) (A\mid B)\xrightarrow{}(I\mid X) (AB) (IX)
本例计算过程如下
[ 1 0 1 1 1 − 1 1 1 0 1 2 − 1 1 − 1 0 ] → [ 1 0 0 3 1 0 1 0 5 2 0 0 1 − 2 0 ] \begin{bmatrix} \begin{array}{ccc:cc} 1&0&1&1&1\\ -1&1&1&0&1\\ 2&-1&1&-1&0 \end{array} \end{bmatrix}\to \begin{bmatrix} \begin{array}{ccc:cc} 1&0&0&3&1\\ 0&1&0&5&2\\ 0&0&1&-2&0 \end{array} \end{bmatrix} 112011111101110 100010001352120

[ x 1 y 1 x 2 y 2 x 3 y 3 ] = [ 3 1 5 2 − 2 0 ] \begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\end{bmatrix}= \begin{bmatrix}3&1\\5&2\\-2&0\end{bmatrix} x1x2x3y1y2y3 = 352120

矩阵的秩

行空间:矩阵 A = ( r 1 , r 2 , ⋯   , r m ) T A=(\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m)^T A=(r1,r2,,rm)T 的所有行向量张成的空间称为 A A A 的行空间,记为
row  A = span { r 1 , r 2 , ⋯   , r m } \text{row }A=\text{span}\{\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m\} row A=span{r1,r2,,rm}
若两个矩阵 A A A B B B 行等价,则它们的的行空间相同。若 B B B 是阶梯型矩阵,则 B B B 的非零行构成 row  B \text{row }B row B 的一组基,同时也是 row  A \text{row }A row A 的一组基。

证明:若 B B B 是由 A A A 经行变换得到的,则 B B B 的行是 A A A 的行的线性组合,于是 B B B 的行的任意线性组合自然是 A A A 的行的线性组合,从而 B B B 的行空间包含于 A A A 的行空间。因为行变换可逆,同理知 A A A 的行空间是 B B B 的行空间的子集,从而这两个空间相同。若 B B B 是一个阶梯形矩阵,则其非零行是线性无关的,这是因为任何一个非零行均不为它下面的非零行的线性组合,于是 B B B 的非零行构成 B B B 的行空间的一组基,当然也是 A A A 的行空间的一组基。

例:分别求矩阵 A A A 的行空间、列空间和零空间的基
A = [ − 2 − 5 8 0 − 17 1 3 − 5 1 5 3 11 − 19 7 1 1 7 − 13 5 − 3 ] A=\begin{bmatrix}-2&-5&8&0&-17\\1&3&-5&1&5\\3&11&-19&7&1\\1&7&-13&5&-3\end{bmatrix} A= 213153117851913017517513
解:为了求行空间和列空间的基,行化简 A A A成阶梯形
A → [ 1 3 − 5 1 5 0 1 − 2 2 − 7 0 0 0 − 4 20 0 0 0 0 0 ] = B A\to \begin{bmatrix}1&3&-5&1&5\\0&1&-2&2&-7\\0&0&0&-4&20\\0&0&0&0&0\end{bmatrix}=B A 100031005200124057200 =B
矩阵 B B B 的前 3 行构成 B B B的行空间的一个基,也是 A A A的行空间的一组基。

row  A \text{row }A row A 的基: ( 1 , 3 , − 5 , 1 , 5 ) , ( 0 , 1 , − 2 , 2 , − 7 ) , ( 0 , 0 , 0 , − 4 , 20 ) (1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20) (1,3,5,1,5),(0,1,2,2,7),(0,0,0,4,20)

对列空间, B B B 的主元列在第1,2和4列,从而 A A A 的第1,2和4列构成 col  A \text{col }A col A 的一组基。

col  A \text{col }A col A 的基: ( − 2 , 1 , 3 , 1 ) T , ( − 5 , 3 , 11 , 7 ) T , ( 0 , 1 , 7 , 5 ) T (-2,1,3,1)^T,(-5,3,11,7)^T,(0,1,7,5)^T (2,1,3,1)T,(5,3,11,7)T,(0,1,7,5)T

对于核空间,需要进一步行变换得简化阶梯型矩阵
B → [ 1 0 1 0 1 0 1 − 2 0 3 0 0 0 1 − 5 0 0 0 0 0 ] = C B\to\begin{bmatrix}1&0&1&0&1\\0&1&-2&0&3\\0&0&0&1&-5\\0&0&0&0&0\end{bmatrix}=C B 10000100120000101350 =C
方程 A x = 0 A\mathbf x=0 Ax=0 的解空间等价于 C x = 0 C\mathbf x=0 Cx=0 的解空间,即
{ x 1 + x 3 + x 5 = 0 x 2 − 2 x 3 + 3 x 5 = 0 x 4 − 5 x 5 = 0 \begin{cases} x_1+x_3+x_5=0 \\ x_2-2x_3+3x_5=0 \\ x_4-5x_5=0 \end{cases} x1+x3+x5=0x22x3+3x5=0x45x5=0
所以
[ x 1 x 2 x 3 x 4 x 5 ] = x 3 [ − 1 2 1 0 0 ] + x 5 [ − 1 − 3 0 5 1 ] \begin{bmatrix}x_1\\x_2\\x_3\\x_4\\x_5\end{bmatrix}= x_3\begin{bmatrix}-1\\2\\1\\0\\0\end{bmatrix}+ x_5\begin{bmatrix}-1\\-3\\0\\5\\1\end{bmatrix} x1x2x3x4x5 =x3 12100 +x5 13051
ker ⁡ A \ker A kerA 的基: ( − 1 , 2 , 1 , 0 , 0 ) T , ( − 1 , − 3 , 0 , 5 , 1 ) T (-1,2,1,0,0)^T,(-1,-3,0,5,1)^T (1,2,1,0,0)T,(1,3,0,5,1)T

通过观察可见,与 col  A \text{col }A col A 的基不同, row  A \text{row }A row A ker ⁡ A \ker A kerA 的基与 A A A 中的元素没有直接的关系。

定理:对于 m × n m\times n m×n 维矩阵 A A A

  1. dim ⁡ ( row  A ) = dim ⁡ ( col  A ) = rank  A \dim(\text{row }A)=\dim(\text{col }A)=\text{rank }A dim(row A)=dim(col A)=rank A
  2. rank  A + dim ⁡ ( ker ⁡ A ) = n \text{rank }A+\dim(\ker A)=n rank A+dim(kerA)=n

证明: rank  A \text{rank }A rank A A A A中主元列的个数,也是 A A A的等价阶梯形矩阵 B B B中主元列的个数。进一步,因为 B B B 的每个主元都对应一个非零行,同时这些非零行构成 A A A 的行空间的一组基,所以 A A A 的秩等于 row  A \text{row }A row A 的维数。由于 ker ⁡ A \ker A kerA 的维数等于方程 A x = 0 A\mathbf x=0 Ax=0 中自由变量的个数,换句话说, ker ⁡ A \ker A kerA 的维数是 A A A 中非主元列的个数。上面的定理证闭。

性质

  1. 矩阵的秩在初等变换下保持不变
  2. 矩阵的列向量组的秩等于行向量组的秩
  3. rank ( A + B ) ⩽ rank ( A ) + rank ( B ) \text{rank}(A+B)\leqslant \text{rank}(A)+\text{rank}(B) rank(A+B)rank(A)+rank(B)
  4. rank ( k A ) = rank ( A ) \text{rank}(kA)=\text{rank}(A) rank(kA)=rank(A)
  5. rank ( A B ) ⩽ min ⁡ { rank ( A ) , rank ( B ) } \text{rank}(AB)\leqslant \min\{\text{rank}(A),\text{rank}(B)\} rank(AB)min{rank(A),rank(B)}

广义逆矩阵

对于非其次线性方程组 A x = b A\mathbf x=\mathbf b Ax=b ,当 A A A 可逆时,则方程组存在唯一解 x = A − 1 b \mathbf x=A^{-1}\mathbf b x=A1b,通常矩阵 A A A 是任意的 m × n m\times n m×n 矩阵,不可逆的,这就促使人们去推广逆矩阵的概念,引进某种具有普通逆矩阵类似性质的矩阵 G G G,使得方程组的解仍可表示为 x = G b \mathbf x=G\mathbf b x=Gb 这种简单的形式。

  • A G A = A AGA=A AGA=A,则 A x = A G A x = A ( G b ) = b A\mathbf x=AGA\mathbf x=A(G\mathbf b)=\mathbf b Ax=AGAx=A(Gb)=b,于是 G b G\mathbf b Gb 是方程的解;
  • G A G = G GAG=G GAG=G,由于 G A x = G b GA\mathbf x=G\mathbf b GAx=Gb,所以 G A x = G A G A x = G A ( G b ) = G b GA\mathbf x=GAGA\mathbf x=GA(G\mathbf b)=G\mathbf b GAx=GAGAx=GA(Gb)=Gb,于是 G b G\mathbf b Gb 是方程的解;

对于 m × n m\times n m×n 维矩阵 A A A,若存在 n × m n\times m n×m 维矩阵 G G G 满足以下 M-P 方程
(1) A G A = A AGA=A AGA=A
(2) G A G = G GAG=G GAG=G
(3) ( A G ) T = A G (AG)^T=AG (AG)T=AG
(4) ( G A ) T = G A (GA)^T=GA (GA)T=GA

的全部或一部分,则称 G G G A A A 的一个广义逆矩阵。若 G G G 满足全部 M-P 方程,则称 G G G A A A 的 Moore-Penrose 广义逆矩阵,简称M-P 广义逆矩阵,也称为伪逆矩阵,记为 A + A^+ A+。事实上,只有伪逆矩阵存在且唯一,其他各类广义逆矩阵都不唯一。

性质

  1. ( A + ) + = A (A^+)^+=A (A+)+=A
  2. ( A T ) + = ( A + ) T (A^T)^+=(A^+)^T (AT)+=(A+)T
  3. rank  A + = rank  A \text{rank }A^+=\text{rank }A rank A+=rank A

若非其次线性方程组 A x = b A\mathbf x=\mathbf b Ax=b 有解,则解为
x = A + b + ( I − A + A ) c \mathbf x=A^+\mathbf b+(I-A^+A)\mathbf c x=A+b+(IA+A)c
其中 c \mathbf c c 是维数与 x \mathbf x x 的维数相同的任意向量。显然,当 A A A 可逆时, x = A − 1 b + ( I − A − 1 A ) c = A − 1 b \mathbf x=A^{-1}\mathbf b+(I-A^{-1}A)\mathbf c=A^{-1}\mathbf b x=A1b+(IA1A)c=A1b

求伪逆矩阵的一个方法是利用奇异值分解 A = U Σ V T A=U\Sigma V^T A=UΣVT 。由于 Λ r \Lambda_r Λr 的对角线元素非零,所以 Λ r \Lambda_r Λr 可逆,可求得伪逆为
A + = V r Λ r − 1 U r T A^+=V_r\Lambda_r^{-1} U^T_r A+=VrΛr1UrT

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值