[矩阵论] Unit 4. 矩阵的广义逆 - 知识点整理

  • 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
  • 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005

4 矩阵的广义逆

4.1 矩阵的左逆与右逆

左逆 右逆

Def’ 4.1: 设 A ∈ C m × n A\in C^{m\times n} ACm×n

  • ∃ B ∈ C n × m \exists B\in C^{n\times m} BCn×m, B A = I n BA=I_n BA=In, 则 B B B A A A 左逆, 记为 A L − 1 A_L^{-1} AL1
  • ∃ C ∈ C n × m \exists C\in C^{n\times m} CCn×m, A C = I m AC=I_m AC=Im, 则 C C C A A A 右逆, 记为 A R − 1 A_R^{-1} AR1

左逆:
必要条件 ⇒ n = r ( B A ) ≤ r ( A ) ≤ m n=r(BA)\leq r(A)\leq m n=r(BA)r(A)m
充要条件:
A A A 列满秩(瘦高) n = r a n k ( A ) ≤ m n=rank(A)\leq m n=rank(A)m
A H A A^HA AHA 可逆 ( A L − 1 A = ( ( A H A ) − 1 A H ) A = I n A_L^{-1}A=((A^HA)^{-1}A^H)A=I_n AL1A=((AHA)1AH)A=In) ⇒ 左逆求法: A L − 1 = ( A H A ) − 1 A H A_L^{-1}=(A^HA)^{-1}A^H AL1=(AHA)1AH
⟺ 零空间 N ( A ) = { 0 } N(A)=\{0\} N(A)={0}

右逆:
必要条件 ⇒ m = r ( A C ) ≤ r ( A ) ≤ n m=r(AC)\leq r(A)\leq n m=r(AC)r(A)n
充要条件:
A A A 行满秩(矮胖) m = r a n k ( A ) ≤ n m=rank(A)\leq n m=rank(A)n
A A H AA^H AAH 可逆 ( A A R − 1 = A ( A H ( A A H ) − 1 ) = I m AA_R^{-1}=A(A^H(AA^H)^{-1})=I_m AAR1=A(AH(AAH)1)=Im) ⇒ 右逆求法: A R − 1 = A H ( A A H ) − 1 A_R^{-1}=A^H(AA^H)^{-1} AR1=AH(AAH)1
⟺ 列空间 R ( A ) = C m R(A)=C^m R(A)=Cm

m ≠ n m\neq n m=n 时, 左逆和右逆不可能同时存在

单侧逆求解线性方程组

求解线性方程组: A m × n X n = b m A_{m\times n}X_n=b_m Am×nXn=bm

左可逆矩阵:

  • 条件: ( I m − A A L − 1 ) b = 0 (I_m-AA_L^{-1})b=0 (ImAAL1)b=0
  • 唯一解: ( A H A ) − 1 A H b (A^HA)^{-1}A^Hb (AHA)1AHb ( A L − 1 A_L^{-1} AL1 不唯一, 但 A L − 1 b A_L^{-1}b AL1b 唯一)
    理解: A A A 左可逆是列满秩瘦高的矩阵, 相当于 A X = b AX=b AX=b 有过多等式, 等式个数大于未知数个数, 即 m > n m > n m>n, 此时等式过多很可能没有解, 有解也是唯一解.

右可逆矩阵:

  • 条件: 无(都有解)
  • 多个解: 任一 A R − 1 b A_R^{-1}b AR1b (所以 A H ( A A H ) − 1 b A^H(AA^H)^{-1}b AH(AAH)1b 是一个解)
    理解: A A A 右可逆是行满秩矮胖的矩阵, 相当于 A X = b AX=b AX=b 等式个数小于未知数个数, 即 m < n m < n m<n, 所以一定有解, 且解不唯一.

4.2 广义逆矩阵

减号广义逆

Def’ 4.2 减号逆: A ∈ C m × n A\in C^{m\times n} ACm×n, 若 G ∈ C n × m G\in C^{n\times m} GCn×m 使得
A G A = A AGA=A AGA=A
则称矩阵 G G G A A A 的减号(广义)逆, 或 {1}-逆.
A A A 的全部减号逆集合记为 A { 1 } = { A 1 − , A 2 − , . . . } A\{1\}=\{A_1^-,A_2^-,...\} A{1}={A1,A2,...}

A A A 可逆, 则 A − 1 ∈ A { 1 } A^{-1}\in A\{1\} A1A{1}
A A A 单侧可逆, 则 A L − 1 ∈ A { 1 } A_L^{-1}\in A\{1\} AL1A{1}/ A R − 1 ∈ A { 1 } A_R^{-1}\in A\{1\} AR1A{1}
A = 0 A=0 A=0, 则 A { 1 } = C m × n A\{1\}=C^{m\times n} A{1}=Cm×n

Th 4.5: A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n},rank(A)=r ACm×n,rank(A)=r, 若存在可逆阵 P , Q P,Q P,Q 使 P A Q = [ I r 0 0 0 ] PAQ=\begin{bmatrix}I_r&0\\0&0\end{bmatrix} PAQ=[Ir000], 则 A − ∈ A { 1 } A^-\in A\{1\} AA{1}
A − = Q [ I r U V W ] n × m P A^-=Q\begin{bmatrix} I_r&U\\ V&W \end{bmatrix}_{n\times m}P A=Q[IrVUW]n×mP
其中 U ∈ C r × ( m − r ) U\in C^{r\times (m-r)} UCr×(mr), V ∈ C ( n − r ) × r V\in C^{(n-r)\times r} VC(nr)×r, W ∈ C ( n − r ) × ( m − r ) W\in C^{(n-r)\times(m-r)} WC(nr)×(mr)
是任意的.

减号逆性质 A ∈ C m × n , A − A\in C^{m\times n}, A^- ACm×n,A:

  • A A A 可逆时减号逆唯一.
  • r a n k ( A ) ≤ r a n k ( A − ) rank(A)\leq rank(A^-) rank(A)rank(A) ( A − ∼ [ I r U V W ] A^-\sim\begin{bmatrix}I_r&U\\V&W\end{bmatrix} A[IrVUW])
  • A A − AA^- AA A − A A^-A AA 都是幂等阵, 且 r a n k ( A ) = r a n k ( A A − ) = r a n k ( A − ) rank(A) = rank(AA^-) = rank(A^-) rank(A)=rank(AA)=rank(A)
  • R ( A A − ) = R ( A ) R(AA^-)=R(A) R(AA)=R(A), N ( A − A ) = N ( A ) N(A^-A)=N(A) N(AA)=N(A)

减号逆求法

目标: 求 A ∈ C m × n A\in C^{m\times n} ACm×n 的减号逆 A − ∈ C n × m A^-\in C^{n\times m} ACn×m

  1. 构造增广矩阵
    [ A I I 0 ] \left[\begin{array}{c:c} A&I\\ \hdashline I&0 \end{array}\right] [AII0]
  2. 对该增广矩阵先进行行初等变换得到最简形; 再进行列初等变换, 至最简形每一行只有最左侧一个"1", 即 A A A 转换为 [ I r 0 0 0 ] \begin{bmatrix}I_r&0\\0&0\end{bmatrix} [Ir000] , 此时增广矩阵即为:
    [ ( I r 0 0 0 ) P Q 0 ] \left[\begin{array}{c:c} \begin{pmatrix}I_r&0\\0&0\end{pmatrix}&P\\ \hdashline Q&0 \end{array}\right] (Ir000)QP0
  3. 由上述增广矩阵得到 P , Q P,Q P,Q, 取大小符合的任意 U , V , W U,V,W U,V,W 构成 [ I r U V W ] n × m \begin{bmatrix}I_r&U\\V&W\end{bmatrix}_{n\times m} [IrVUW]n×m

减号逆求解线性方程组

A ∈ C m × n , A − ∈ A { 1 } A\in C^{m\times n}, A^-\in A\{1\} ACm×n,AA{1}. 若 A m × n X n = b m A_{m\times n}X_n = b_m Am×nXn=bm 有解, 则其通解可表示为: X = A − b + ( I n − A − A ) z X=A^-b+(I_n-A^-A)z X=Ab+(InAA)z, z ∈ C n z\in C^n zCn 任意.
( A − b A^-b Ab A X = b AX=b AX=b 特解, ( I n − A − A ) z (I_n-A^-A)z (InAA)z A x = 0 Ax=0 Ax=0 通解)

M-P 广义逆(加号广义逆)

Def 4.3’ 加号逆: 设矩阵 A ∈ C m × n A\in C^{m\times n} ACm×n, 若 ∃ G ∈ C n × m \exists G\in C^{n\times m} GCn×m 使得:
A G A = A AGA = A AGA=A
G A G = G GAG = G GAG=G
( A G ) H = A G (AG)^H = AG (AG)H=AG
( G A ) H = G A (GA)^H = GA (GA)H=GA
则称 G G G A A A 的 M-P 广义逆(加号逆), 记为 G = A + G=A^+ G=A+.

矩阵的加号逆存在且唯一.

加号逆性质 A ∈ C m × n , A + A\in C^{m\times n}, A^+ ACm×n,A+:

  • ( A + ) + = A (A^+)^+=A (A+)+=A
  • ( A + ) H = ( A H ) + (A^+)^H=(A^H)^+ (A+)H=(AH)+
  • ( λ A ) + = λ + A + (\lambda A)^+=\lambda^+A^+ (λA)+=λ+A+, 其中 λ + = { 1 λ , λ ≠ 0 0 , λ = 0 \lambda^+=\begin{cases}\frac{1}{\lambda},&\lambda\neq0\\0,&\lambda=0\end{cases} λ+={λ1,0,λ=0λ=0
  • A A A 列满秩: A + = ( A H A ) − 1 A H A^+=(A^HA)^{-1}A^H A+=(AHA)1AH (左逆的特殊解)
    A A A 行满秩: A + = A H ( A A H ) − 1 A^+=A^H(AA^H)^{-1} A+=AH(AAH)1 (右逆的特殊解)
  • A A A满秩分解: A = B C A=BC A=BC, 则 A + = C + B + \pmb{A^+=C^+B^+} A+=C+B+A+=C+B+A+=C+B+
  • r a n k ( A ) = r a n k ( A + ) = r a n k ( A A + ) = r a n k ( A + A ) rank(A)=rank(A^+)=rank(AA^+)=rank(A^+A) rank(A)=rank(A+)=rank(AA+)=rank(A+A)

加号逆求法

目标: 求 A ∈ C m × n A\in C^{m\times n} ACm×n 的加号逆 A + ∈ C n × m A^+\in C^{n\times m} A+Cn×m

法一:

  1. A A A 进行满秩分解, 得到列满秩和行满秩的 B , C B,C B,C
  2. 利用左右逆的特殊解求 B , C B,C B,C 的加号逆: B + = ( B H B ) − 1 B H B^+=(B^HB)^{-1}B^H B+=(BHB)1BH, C + = C H ( C C H ) − 1 C^+=C^H(CC^H)^{-1} C+=CH(CCH)1
  3. 求得 A A A 的加号逆 A + = C + B + A^+=C^+B^+ A+=C+B+

法二:

  1. A A A 进行奇异值分解, 得 A = U m × m [ Δ 0 0 0 ] m × n V n × n H A=U_{m\times m}\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}_{m\times n}V^H_{n\times n} A=Um×m[Δ000]m×nVn×nH
  2. 则矩阵加号逆:
    A + = V [ Δ − 1 0 0 0 ] n × m U H A^+=V\begin{bmatrix}\Delta^{-1}&0\\0&0\end{bmatrix}_{n\times m}U^H A+=V[Δ1000]n×mUH

特殊矩阵的加号逆:

  • [ 0 ] m × n + = [ 0 ] n × m [0]_{m\times n}^+=[0]_{n\times m} [0]m×n+=[0]n×m
  • [ a ] + = [ 1 a ] [a]^+=[\frac{1}{a}] [a]+=[a1]
  • d i a g ( λ 1 , . . . , λ n ) + = d i a g ( λ 1 + , . . . , λ n + ) diag(\lambda_1,...,\lambda_n)^+=diag(\lambda_1^+,...,\lambda_n^+) diag(λ1,...,λn)+=diag(λ1+,...,λn+)
  • 非零向量 x = ( x 1 , . . . , x n ) T x=(x_1,...,x_n)^T x=(x1,...,xn)T, x + = x H ∣ ∣ x ∣ ∣ 2 x^+=\frac{x^H}{||x||^2} x+=x2xH

4.3 投影变换

投影变换 投影矩阵

Def’ 4.4: 设 C n = L ⊕ M C^n =L\oplus M Cn=LM, 向量 x ∈ C n x\in C^n xCn, x = y + z , y ∈ L , z ∈ M x = y + z, y\in L, z\in M x=y+z,yL,zM, 如果线性变换 σ : C n → C n \sigma:C^n\rightarrow C^n σ:CnCn, σ ( x ) = y \sigma(x) = y σ(x)=y, 则称 σ \sigma σ 为从 C n C^n Cn 沿子空间 M M M 到子空间 L L L ( y ∈ L y\in L yL)的投影变换. 投影变换在 C n C^n Cn 空间的一组基下的矩阵称为投影矩阵.

C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)N(σ)

  • R ( σ ) = L R(\sigma)=L R(σ)=L: 像空间
  • N ( σ ) = M N(\sigma)=M N(σ)=M: 核空间

C n C^n Cn 上线性变换 σ \sigma σ 是投影变换 ⟺ σ \sigma σ幂等变换 ⟺ 变换矩阵在某组基下是幂等矩阵 A 2 = A A^2=A A2=A

自然基下投影矩阵求法:
L L L 的投影矩阵: A = ( B ∣ 0 ) ( B ∣ C ) − 1 A=(B|0)(B|C)^{-1} A=(B0)(BC)1
M M M 的投影矩阵: A ~ = I n − A \tilde{A}=I_n-A A~=InA

  • B B B: 空间 L L L 的基构成的矩阵
  • C C C: 空间 M M M 的基构成的矩阵

正交投影变换

Def’ 4.5: σ \sigma σ C n C^n Cn 上投影变换 C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)N(σ). 若 R ( σ ) R(\sigma) R(σ) 正交补子空间 R ( σ ) ⊥ = N ( σ ) R(\sigma)^\perp=N(\sigma) R(σ)=N(σ), 则 σ \sigma σ 是正交投影变换.

C n C^n Cn 上线性变换 σ \sigma σ 是正交投影变换 ⟺ 变换矩阵在某组基下是幂等 Hermite 矩阵 A 2 = A , A H = A A^2=A, A^H=A A2=A,AH=A

正交投影变换(向量)表示: P ( x ) = x − ( x , u ) u P(x)=x-(x,u)u P(x)=x(x,u)u, u u u 为投影平面的法向

自然基下正交投影矩阵求法: B H C = 0 B^HC=0 BHC=0
L L L 的投影矩阵: A = ( B ∣ 0 ) ( B ∣ C ) − 1 = B ( B H B ) − 1 B H A=(B|0)(B|C)^{-1}=B(B^HB)^{-1}B^H A=(B0)(BC)1=B(BHB)1BH
M M M 的投影矩阵: A ~ = I n − A = C ( C H C ) − 1 C H \tilde{A}=I_n-A=C(C^HC)^{-1}C^H A~=InA=C(CHC)1CH

  • B B B: 空间 L L L 的基构成的矩阵
  • C C C: 空间 M M M 的基构成的矩阵

正交投影变换性质:
Th 4.16: 设 W W W C n C^n Cn 的子空间, x 0 ∈ C n , x 0 ∈ W x_0\in C^n, x_0\in W x0Cn,x0W, 如果 σ \sigma σ 是空间 C n C^n Cn 向空间 W W W 的正交投影, 则:
∣ ∣ σ ( x 0 ) − x 0 ∣ ∣ ≤ ∣ ∣ y − x 0 ∣ ∣ , ∀ y ∈ W ||\sigma(x_0)-x_0||\leq||y-x_0||,\forall y\in W σ(x0)x0yx0,yW
含义: 点 σ ( x 0 ) \sigma(x_0) σ(x0) 是空间 W W W 中与点 x 0 x_0 x0 距离最近的点

正交投影与 A + A A^+A A+A A A + AA^+ AA+

Th 4.15: A ∈ C m × n A\in C^{m\times n} ACm×n
A + A ∈ C n × n A^+A\in C^{n\times n} A+ACn×n 性质:

  • ( A + A ) 2 = A + A , ( A + A ) H = A + A (A^+A)^2=A^+A, (A^+A)^H=A^+A (A+A)2=A+A,(A+A)H=A+A
  • { C n = R ( A + ) ⊕ N ( A ) R ( A + ) ⊥ = N ( A ) \begin{cases}C^n=R(A^+)\oplus N(A)\\R(A^+)^\perp=N(A)\end{cases} {Cn=R(A+)N(A)R(A+)=N(A)
    { C n = R ( A + A ) ⊕ N ( A + A ) R ( A + A ) = R ( A + ) , N ( A + A ) = N ( A ) \begin{cases}C^n=R(A^+A)\oplus N(A^+A)\\R(A^+A)=R(A^+),N(A^+A)=N(A)\end{cases} {Cn=R(A+A)N(A+A)R(A+A)=R(A+),N(A+A)=N(A)
    含义: A + A A^+A A+A 是正交投影, 它将向量 x x x 投影到空间 R ( A + ) R(A+) R(A+)

A A + ∈ C m × m AA^+\in C^{m\times m} AA+Cm×m 性质:

  • ( A A + ) 2 = A A + , ( A + A ) H = A A + (AA^+)^2=AA^+, (A^+A)^H=AA^+ (AA+)2=AA+,(A+A)H=AA+
  • { C m = R ( A ) ⊕ N ( A + ) R ( A ) ⊥ = N ( A + ) \begin{cases}C^m=R(A)\oplus N(A^+)\\R(A)^\perp=N(A^+)\end{cases} {Cm=R(A)N(A+)R(A)=N(A+)
    { C m = R ( A A + ) ⊕ N ( A A + ) R ( A A + ) = R ( A ) , N ( A A + ) = N ( A + ) \begin{cases}C^m=R(AA^+)\oplus N(AA^+)\\R(AA^+)=R(A),N(AA^+)=N(A^+)\end{cases} {Cm=R(AA+)N(AA+)R(AA+)=R(A),N(AA+)=N(A+)
    含义: A A + AA^+ AA+ 是正交投影, 它将向量 x x x 投影到空间 R ( A ) R(A) R(A)
    在这里插入图片描述

4.4 最佳的最小二乘解

最小二乘解 最佳最小二乘解

A ∈ C m × n , b ∈ C m A\in C^{m\times n}, b\in C^m ACm×n,bCm
最小二乘解 u ∈ C n u\in C^n uCn ∣ ∣ A u − b ∣ ∣ ≤ ∣ ∣ A x − b ∣ ∣ , ∀ x ∈ C n ||Au-b||\leq||Ax-b||,\forall x\in C^n AubAxb,xCn
最佳最小二乘解 x 0 ∈ C n x_0\in C^n x0Cn ∣ ∣ x 0 ∣ ∣ 2 ≤ ∣ ∣ u ∣ ∣ 2 ||x_0||_2\leq||u||_2 x02u2

A x = b Ax=b Ax=b 最佳最小二乘解

有解性判断:
A m × n x n = b m A_{m\times n}x_n=b_m Am×nxn=bm

  • 有解 ⟺ b ∈ R ( A ) b\in R(A) bR(A)
  • 无解 ⟺ b ∉ R ( A ) b\not\in R(A) bR(A)

x 0 = A + b x^0=A^+b x0=A+b A m × n x n = b m A_{m\times n}x_n=b_m Am×nxn=bm 的最佳最小二乘解.

最佳拟合曲线

利用数据 ( x 1 , y 1 ) , . . . ( x n , y n ) (x_1,y_1),...(x_n,y_n) (x1,y1),...(xn,yn)使具有两个参数 β 1 , β 2 \beta_1,\beta_2 β1,β2 的经验公式 f ( x , y ) f(x,y) f(x,y) 误差最小
方法:

  1. 根据经验公式 f ( x , y ) f(x,y) f(x,y)代入数据构造矩阵方程
    [ x 1 y 1 ⋯ ⋯ x n y n ] [ β 1 β 2 ] = [ ⋯ ] \begin{bmatrix} x_1&y_1\\ \cdots&\cdots\\ x_n&y_n \end{bmatrix}\begin{bmatrix} \beta_1\\ \beta_2 \end{bmatrix}=\begin{bmatrix} \\ \cdots\\ \\ \end{bmatrix} x1xny1yn[β1β2]=
  2. A x = b Ax=b Ax=b 的最佳最小二乘解 A + b A^+b A+b 确定 β 1 , β 2 \beta_1,\beta_2 β1,β2
  3. 误差即 ∣ ∣ A β − b ∣ ∣ 2 ||A\beta-b||_2 Aβb2
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值