子空间的投影矩阵推导过程及其性质

一维投影

在这里插入图片描述
设向量 b b b 在子空间 a a a 上的投影为 向量 p = x a p = xa p=xa,则向量b 与 向量p 之间的最小误差 e = b − p e=b-p e=bp与子空间 a a a正交。

由正交的定义有: a T ( b − p ) = 0 → a T ( b − x a ) = 0 a^T(b-p)=0 \rightarrow a^T(b-xa)=0 aT(bp)=0aT(bxa)=0

所以: a T a x = a T b a^Tax=a^Tb aTax=aTb

所以: x = a T b a T a = a ⋅ b a ⋅ a x = \frac{a^Tb}{a^Ta} = \frac{a \cdot b}{a \cdot a} x=aTaaTb=aaab

向量b 在子空间 a上的投影 p = a x = a a T b a T a p=ax =a\frac{a^Tb}{a^Ta} p=ax=aaTaaTb

上式也可写成: p = a a T a T a b p=\frac{aa^T}{a^Ta}b p=aTaaaTb

其中 a a T a T a \frac{aa^T}{a^Ta} aTaaaT 称为子空间 a 的投影矩阵 P P P

  • 注意到 a a T aa^T aaT 是一个矩阵, a T a a^Ta aTa 是一个数字,所以两者相除,得到的是一个矩阵

投影矩阵 P P P 的性质:

  • P P P 是对称矩阵,即 P T = P P^T =P PT=P
  • 投影两次,不会改变投影结果,即 P 2 = P P^2=P P2=P
二维投影
  • 投影的意义:对于方程组 A x = b Ax =b Ax=b,如果 b b b 不在 矩阵 A A A 的列空间中,则方程组无精确解,这时可以通过将 b 投影到 A A A的列空间 C ( A ) C(A) C(A)得到 p p p,然后求解 A x ^ = p A\hat{x}=p Ax^=p 来得到近似解。

在这里插入图片描述
a 1 a_1 a1 a 2 a_2 a2 是矩阵 A 的列空间的基, p p p b b b 在 A的列空间的投影, e e e b b b 垂直于A的列空间的分量。

所以 p = x 1 ^ a 1 + x 2 ^ a 2 = A x ^ p=\hat{x_1}a_1+\hat{x_2}a_2 = A\hat{x} p=x1^a1+x2^a2=Ax^ x ^ \hat{x} x^ 是我们需要求的目标。

e = b − p e=b-p e=bp,表示 b b b的实际值与近似值 p p p之间的误差,当 e e e 垂直于 A A A的列空间时,这个误差最小,此时求解得到的解即为最优解

因为 e = b − p = b − A x ^ e = b - p = b - A\hat{x} e=bp=bAx^ 垂直于 A的列空间,所以 e e e 分别与 A 的基 a 1 a_1 a1 a 2 a_2 a2 垂直

所以有 a 1 T e = 0 a_1^Te=0 a1Te=0 a 2 T e = 0 a_2^Te=0 a2Te=0

即: [ a 1 T a 2 T ] e = A T ( b − A x ^ ) = A T b − A T A x ^ = 0 → A T A x ^ = A T b \begin{bmatrix}a_1^T \\a_2^T \end{bmatrix}e=A^T(b-A\hat{x})=A^Tb-A^TA\hat{x}=0 \rightarrow A^TA\hat{x}=A^Tb [a1Ta2T]e=AT(bAx^)=ATbATAx^=0ATAx^=ATb

所以 x ^ = ( A T A ) − 1 A T b \hat{x}=(A^TA)^{-1}A^Tb x^=(ATA)1ATb

又因为 p = A x ^ = A ( A T A ) − 1 A T b p=A\hat{x}=A(A^TA)^{-1}A^Tb p=Ax^=A(ATA)1ATb

p p p b b b 在 A的列空间上的投影,所以A 的投影矩阵为 P = A ( A T A ) − 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)1AT

如果 A 是可逆矩阵,则有 P = A A − 1 ( A T ) − 1 A T = I P=AA^{-1}(A^T)^{-1}A^T = I P=AA1(AT)1AT=I,此时 b 在 A的列空间中,b 的投影还是它自身,所以投影矩阵为 单位矩阵 I I I

n n n 维的投影矩阵 P P P 的性质:

  • P P P 是对称矩阵,即 P T = P P^T=P PT=P
  • P 2 = P P^2=P P2=P

由以上讨论可得到: b = P b + P N b b = Pb + P_Nb b=Pb+PNb,其中 P N P_N PN 是垂直于矩阵 A 的法向量,于是有 I b = P b + P n b → I = P + P N → P = I − P N Ib = Pb + P_nb \rightarrow I = P+P_N \rightarrow P=I-P_N Ib=Pb+PnbI=P+PNP=IPN。所以可以通过求解法向量的投影矩阵,间接得到 矩阵A 的投影矩阵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值