MIT线性代数笔记-第15讲-子空间投影

15.子空间投影

用途:用于在 A x ⃗ = b ⃗ A \vec{x} = \vec{b} Ax =b 无解(即 b ⃗ \vec{b} b 不属于 A A A的列空间)时,将 b ⃗ \vec{b} b 投影至 A A A的列空间,从而得到一个最接近的解 x ⃗ ^ \widehat{\vec{x}} x

  1. 考虑向量投影至向量
    在这里插入图片描述
    p ⃗ = x a ⃗ \vec{p} = x \vec{a} p =xa

    因为 e ⃗ ⊥ a ⃗ \vec{e} \perp \vec{a} e a ,即 e ⃗ \vec{e} e a ⃗ \vec{a} a 正交,所以 a ⃗ T e ⃗ = a ⃗ T ( b ⃗ − x a ⃗ ) = 0 \vec{a}^T \vec{e} = \vec{a}^T (\vec{b} - x \vec{a}) = 0 a Te =a T(b xa )=0

    化简得 a ⃗ T b ⃗ = a ⃗ T a ⃗ x \vec{a}^T \vec{b} = \vec{a}^T \vec{a} x a Tb =a Ta x,,又 a ⃗ T a ⃗ \vec{a}^T \vec{a} a Ta 为一个常数,左右同除 a ⃗ T a ⃗ \vec{a}^T \vec{a} a Ta 得到 x = a ⃗ T b ⃗ a ⃗ T a ⃗ x = \dfrac{\vec{a}^T \vec{b}}{\vec{a}^T \vec{a}} x=a Ta a Tb

    ∴ p ⃗ = a ⃗ a ⃗ T b ⃗ a ⃗ T a ⃗ \therefore \vec{p} = \vec{a} \dfrac{\vec{a}^T \vec{b}}{\vec{a}^T \vec{a}} p =a a Ta a Tb ,其中 b ⃗ \vec{b} b 翻倍则 p ⃗ \vec{p} p 翻相同倍数, a ⃗ \vec{a} a 翻倍则 p ⃗ \vec{p} p 不变

    由此可知对矩阵 b ⃗ \vec{b} b 进行操作得到了 p ⃗ \vec{p} p

    将操作所用矩阵(即用于生成投影的矩阵)称为投影矩阵,记作 P P P,那么 P = a ⃗ a ⃗ T a ⃗ T a ⃗ , p ⃗ = P b ⃗ P = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} , \vec{p} = P \vec{b} P=a Ta a a T,p =Pb

    • P P P的秩为 1 1 1 P P P中各行均为 a T a^T aT的倍数),且 P P P的列空间即为 a ⃗ \vec{a} a 所在直线, a ⃗ \vec{a} a P P P的一个基

    • b ⃗ \vec{b} b a ⃗ \vec{a} a 共线时, p ⃗ = b ⃗ \vec{p} = \vec{b} p =b

      证明: ①图像说明

      ​    ②设 b ⃗ = y a ⃗ \vec{b} = y \vec{a} b =ya p ⃗ = P b ⃗ = y a ⃗ a ⃗ T a ⃗ T a ⃗ a ⃗ = y a ⃗ = b ⃗ \vec{p} = P \vec{b} = y \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} \vec{a} = y \vec{a} = \vec{b} p =Pb =ya Ta a a Ta =ya =b

    • P P P为对称矩阵

      证明: P = a ⃗ a ⃗ T a ⃗ T a ⃗ P = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} P=a Ta a a T,而 a ⃗ a ⃗ T \vec{a} \vec{a}^T a a T为对称矩阵, a ⃗ T a ⃗ \vec{a}^T \vec{a} a Ta 为一个常数

    • P 2 = P P^2 = P P2=P

      证明: ①用图像可说明 P P b ⃗ = P b ⃗ P P \vec{b} = P \vec{b} PPb =Pb 从而得证

      ​    ② P 2 = a ⃗ a ⃗ T a ⃗ T a ⃗ ⋅ a ⃗ a ⃗ T a ⃗ T a ⃗ = a ⃗ a ⃗ T a ⃗ a ⃗ T ( a ⃗ T a ⃗ ) 2 = a ⃗ a ⃗ T a ⃗ T a ⃗ = P P^2 = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} \cdot \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} = \dfrac{\vec{a} \vec{a}^T \vec{a} \vec{a}^T }{(\vec{a}^T \vec{a})^2} = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} = P P2=a Ta a a Ta Ta a a T=(a Ta )2a a Ta a T=a Ta a a T=P

  2. 考虑向量投影至平面
    在这里插入图片描述
    { a ⃗ 1 , a ⃗ 2 } \{\vec{a}_1 , \vec{a}_2\} {a 1,a 2}为平面的一组基,该平面可表示为矩阵 A = [ a ⃗ 1 a ⃗ 2 ] A = \begin{bmatrix} \vec{a}_1 & \vec{a}_2 \end{bmatrix} A=[a 1a 2]的列空间, p ⃗ = x 1 a ⃗ 1 + x 2 a ⃗ 2 = A x ⃗ \vec{p} = x_1 \vec{a}_1 + x_2 \vec{a}_2 = A \vec{x} p =x1a 1+x2a 2=Ax

    因为 e ⃗ = b ⃗ − p ⃗ \vec{e} = \vec{b} - \vec{p} e =b p 垂直于平面,所以 e ⃗ ⊥ a ⃗ 1 , e ⃗ ⊥ a ⃗ 2 \vec{e} \perp \vec{a}_1 , \vec{e} \perp \vec{a}_2 e a 1,e a 2

    ∴ { a ⃗ 1 T ( b ⃗ − A x ⃗ ) = 0 a ⃗ 2 T ( b ⃗ − A x ⃗ ) = 0 \therefore \left\{\begin{matrix} \vec{a}_1^T (\vec{b} - A \vec{x}) = 0 \\ \vec{a}_2^T (\vec{b} - A \vec{x}) = 0 \end{matrix}\right. {a 1T(b Ax )=0a 2T(b Ax )=0,即 [ a ⃗ 1 T a ⃗ 2 T ] ( b ⃗ − A x ⃗ ) = [ 0 0 ] \begin{bmatrix} \vec{a}_1^T \\ \vec{a}_2^T \end{bmatrix} (\vec{b} - A \vec{x}) = \begin{bmatrix} 0 \\ 0 \end{bmatrix} [a 1Ta 2T](b Ax )=[00],即 A T ( b ⃗ − A x ⃗ ) = 0 ⃗ A^T (\vec{b} - A \vec{x}) = \vec{0} AT(b Ax )=0

    化简得: A T b ⃗ = A T A x ⃗ A^T \vec{b} = A^T A \vec{x} ATb =ATAx ,因而 x ⃗ = ( A T A ) − 1 A T b ⃗ \vec{x} = (A^T A)^{-1} A^T \vec{b} x =(ATA)1ATb (由第 5 5 5节的证明可知 A T A A^T A ATA可逆)

    ∴ p ⃗ = A x ⃗ = A ( A T A ) − 1 A T b ⃗ \therefore \vec{p} = A \vec{x} = A (A^T A)^{-1} A^T \vec{b} p =Ax =A(ATA)1ATb

    ∴ P = A ( A T A ) − 1 A T \therefore P = A (A^T A)^{-1} A^T P=A(ATA)1AT

    由原理及计算过程可以知道 A A A一定要列满秩

    A A A m m m n n n

    • P P P A A A的列空间一致

      证明: p ⃗ = P b ⃗ \vec{p} = P \vec{b} p =Pb 可表示 P P P列空间中的所有向量,且 p ⃗ \vec{p} p 可能为 A A A列空间中任何向量,因而二者列空间一致

      ​    ② P = A ( A T A ) − 1 A T P = A (A^T A)^{-1} A^T P=A(ATA)1AT,其中 ( A T A ) − 1 (A^T A)^{-1} (ATA)1是一个 n n n n n n列的可逆矩阵,行满秩,而 A T A^T AT也行满秩,因而 ( A T A ) − 1 A T (A^{T} A)^{-1} A^{T} (ATA)1AT行满秩且有 n n n个主列

      ​ 又 A A A各列线性无关,因而想得到 P P P中的任意列,均分别对 A A A各列只有一种线性组合方式,这些方式之间 的线性关系与 ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)1AT中各列的线性关系一致,所以 ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)1AT的主列在 P P P中的对应列也是主列 且 P P P只有这 n n n个主列

      ​ 又 P P P的主列均由 A A A的各列线性组合而来且 A A A中各列均参与组合( ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)1AT行满秩,不存在 0 0 0行,所以 A A A不会有任何一列不参与组合),因而 P P P A A A的列空间一致

    • 此时若 A A A是方阵,则 P = I P = I P=I

      证明: A A A为方阵时,其列空间为整个 m m m维空间,包括 b ⃗ \vec{b} b ,因而 b ⃗ \vec{b} b 的投影即为其本身

      ​    ② P = A ( A T A ) − 1 A T = A A − 1 ( A T ) − 1 A T = I P = A (A^T A)^{-1} A^T = A A^{-1} (A^T)^{-1} A^T = I P=A(ATA)1AT=AA1(AT)1AT=I

    • P P P为对称矩阵

      证明: P T = A ( ( A T A ) − 1 ) T A T = A ( ( A T A ) T ) − 1 A T = A ( A T A ) − 1 A T = P P^T = A ((A^T A)^{-1})^T A^T = A((A^T A)^T)^{-1} A^T = A (A^T A)^{-1} A^T = P PT=A((ATA)1)TAT=A((ATA)T)1AT=A(ATA)1AT=P

    • P 2 = P P^2 = P P2=P

      证明: ①用图像可说明 P P b ⃗ = P b ⃗ P P \vec{b} = P \vec{b} PPb =Pb 从而得证

      ​    ② P 2 = A ( A T A ) − 1 A T A ( A T A ) − 1 A T = A ( ( A T A ) − 1 A T A ) ( A T A ) − 1 A T = A ( A T A ) − 1 A T = P P^2 = A (A^T A)^{-1} A^T A (A^T A)^{-1} A^T = A ((A^T A)^{-1} A^T A) (A^T A)^{-1} A^T = A (A^T A)^{-1} A^T = P P2=A(ATA)1ATA(ATA)1AT=A((ATA)1ATA)(ATA)1AT=A(ATA)1AT=P

  3. 个人理解

    将一个向量投影到一个空间本质上相当于在空间中尽可能表示出原向量,或者说在原向量中删去与空间正交的部分

    依几何意义可知投影矩阵一定不可逆


打赏

制作不易,若有帮助,欢迎打赏!
赞赏码

支付宝付款码

  • 34
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寒蜩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值