【线性代数】——投影矩阵

About 投影矩阵

  一个矩阵 A A A既可以表示一种线性变换,又可以是一个子空间(由基张开的),还可以是一组坐标,甚是神奇。

一维空间的投影矩阵

在这里插入图片描述
  查看上图, p p p b b b a a a上的投影,可以发现, p p p a a a是同向的,故可以表示为如下形式,其中 x x x是标量
p = a x p=ax p=ax
  根据 e e e p p p正交的条件,可以推导出 x = a T b a T a x=\frac{a^Tb}{a^Ta} x=aTaaTb,则
p = a a T b a T a = a a T a T a b = P b p=a\frac{a^Tb}{a^Ta}=\frac{aa^T}{a^Ta}b=Pb p=aaTaaTb=aTaaaTb=Pb P = a a T a T a P=\frac{aa^T}{a^Ta} P=aTaaaT
  记 P P P为投影矩阵,说明了向量 b b b a a a上的投影 p p p是一个矩阵作用在 b b b上得到的。
P P P的性质
1. P = P T P=P^T P=PT,对称矩阵一定可以特征值分解
2. r a n k ( P ) = 1 rank(P)=1 rank(P)=1,由单个向量张开的子空间,秩为1
3. P = P 2 P=P^2 P=P2,投影只起一次效果

投影矩阵的多维推广

在这里插入图片描述
  向量 b b b在子空间上的投影是向量 b b b在向量 a a a上投影的推广。即此时向量 a a a变成矩阵 A A A,记 A A A的列空间包含两个向量 a 1 , a 2 a_1,a_2 a1,a2,依旧记向量 b b b A A A空间上的投影为 p p p,则:
p = A x = [ a 1 a 2 ] [ x 1 x 2 ] = a 1 x 1 + a 2 x 2 p=Ax=\begin{bmatrix} a_1&a_2\end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \end{bmatrix}=a_1x_1+a_2x_2 p=Ax=[a1a2][x1x2]=a1x1+a2x2
  误差向量 e e e垂直于列空间的平面,故:
{ a 1 T ( b − p ) = 0 a 2 T ( b − p ) = 0 \left\{ \begin{aligned} a_1^T(b-p)=0 \\ a_2^T(b-p)=0 \end{aligned} \right. {a1T(bp)=0a2T(bp)=0 A T ( b − p ) = 0 A^T(b-p)=0 AT(bp)=0 A T ( b − A x ) = 0 A^T(b-Ax)=0 AT(bAx)=0 A T b = A T A x A^Tb=A^TAx ATb=ATAx x = ( A T A ) − 1 A T b x=(A^TA)^{-1}A^Tb x=(ATA)1ATb
  此时投影向量 p p p的形式为:
p = A x = A ( A T A ) − 1 A T b = P b p=Ax=A(A^TA)^{-1}A^Tb=Pb p=Ax=A(ATA)1ATb=Pb P = A ( A T A ) − 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)1AT
  这存在一个疑问, A T A A^TA ATA是否可逆?若 A A A各列线性无关则可逆。
P P P的性质
1. P = P T P=P^T P=PT,对称矩阵一定可以特征值分解
2. r a n k ( P ) = r a n k ( A ) rank(P)=rank(A) rank(P)=rank(A),由 A A A张开,故等秩
3. P = P 2 P=P^2 P=P2,投影只起一次效果

投影的物理意义

  向量投影到子空间的物理意义是什么?查看线性方程组 A x = b Ax=b Ax=b
A = [ a 1 a 2 ⋯ a n ] , x = [ x 1 x 2 ⋮ x n ] A=\begin{bmatrix} a_1&a_2&\cdots&a_n\end{bmatrix}, x=\begin{bmatrix} x_1 \\ x_2 \\\vdots\\x_n \end{bmatrix} A=[a1a2an],x=x1x2xn b = a 1 x 1 + a 2 x 2 + ⋯ + a n x n b=a_1x_1+a_2x_2+\cdots+a_nx_n b=a1x1+a2x2++anxn
  上式的物理意义:把 A A A中的列向量看成 A A A的列空间中的基, x x x为坐标,则向量 b b b是否可用 A A A中的基线性表示,若出现以下情况:向量 b b b不在 A A A的列空间中,则上式无解。
  此时,若将 b b b投影至 A A A的子空间,即 p = P b = A ( A T A ) − 1 A T b p=Pb=A(A^TA)^{-1}A^Tb p=Pb=A(ATA)1ATb,求解 A x ^ = p A\hat{x}=p Ax^=p,因为 p p p最接近于 b b b,所以近似解 x ^ \hat{x} x^最接近于 x x x,以上即为最小二乘法的几何解释,数学描述如下:
A x = b Ax=b Ax=b A x ^ = A ( A T A ) − 1 A T b A\hat{x}=A(A^TA)^{-1}A^Tb Ax^=A(ATA)1ATb x ^ = ( A T A ) − 1 A T b \hat{x}=(A^TA)^{-1}A^Tb x^=(ATA)1ATb

信号处理中的正交投影技术

  对于信号处理方向,矩阵论非常重要。
  假设空间由干扰源张成的子空间以及噪声子空间构成,那么如何去除干扰?
1.已知干扰
Q = C + P w I , C = D D H Q=C+P_wI, \quad C=DD^H Q=C+PwI,C=DDH
  其中, D D D代表干扰源, C C C是由干扰源构成的协方差矩阵, P w P_w Pw代表噪声功率。
  若干扰源已知,即 D D D已知,则干扰源可用以下投影矩阵对消,全空间-干扰子空间的投影矩阵。
P = I − D ( D H D ) − 1 D H P=I-D(D^HD)^{-1}D^H P=ID(DHD)1DH P D = I D − D I = 0 PD=ID-DI=0 PD=IDDI=0
  综上可以发现,利用正交投影技术,可以将干扰源去掉。

2.未知干扰
  对协方差矩阵 Q Q Q进行特征值分解,将干扰子空间和噪声子空间区分开。
Q = ∑ l = 1 L λ l e l ( i ) ( e l ( i ) ) H + ∑ l = L + 1 N λ l e l ( n ) ( e l ( n ) ) H Q=\sum_{l=1}^{L}{\lambda_le_{l}^{(i)}(e_{l}^{(i)})^H}+ \sum_{l=L+1}^{N}{\lambda_le_{l}^{(n)}(e_{l}^{(n)})^H} Q=l=1Lλlel(i)(el(i))H+l=L+1Nλlel(n)(el(n))H Q = E ( i ) Λ ( i ) ( E ( i ) ) ( H ) + E ( n ) Λ ( n ) ( E ( n ) ) ( H ) Q=E^{(i)}Λ^{(i)}(E^{(i)})^{(H)}+E^{(n)}Λ^{(n)}(E^{(n)})^{(H)} Q=E(i)Λ(i)(E(i))(H)+E(n)Λ(n)(E(n))(H) Q = Q ( i ) + Q ( n ) Q=Q^{(i)}+Q^{(n)} Q=Q(i)+Q(n)
  因为特征向量相互正交,所以令投影矩阵 P = E ( n ) ( E ( n ) ) ( H ) P=E^{(n)}(E^{(n)})^{(H)} P=E(n)(E(n))(H),此时 P D = 0 PD=0 PD=0,这里的 E ( i ) E^{(i)} E(i)就是由干扰 D D D构成的协方差矩阵,当然,也可以写成标准形式:
P = I − E ( i ) ( ( E ( i ) ) ( H ) E ( i ) ) − 1 ( E ( i ) ) ( H ) P=I-E^{(i)}((E^{(i)})^{(H)}E^{(i)})^{-1}(E^{(i)})^{(H)} P=IE(i)((E(i))(H)E(i))1(E(i))(H)
  因为不知道干扰,所以要对特征值及特征向量进行估计,区分哪些属于干扰子空间,哪些属于噪声子空间。

Ref:
https://www.cnblogs.com/bigmonkey/p/9897047.html

  • 30
    点赞
  • 77
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
线性代数中使用各种类型的矩阵,其中最常见的是方阵和矩形矩阵。具体来说,以下是一些常见的矩阵类型和应用: 1. 方阵:一个 $n \times n$ 的矩阵,每一行和每一列都有 $n$ 个元素。它们在线性代数中扮演着非常重要的角色,例如用于描述线性变换、求解线性方程组、计算特征值和特征向量等。 2. 对角矩阵:只有主对角线上有非零元素,其他元素都为零。对角矩阵经常用于表示某些变换的缩放因子。 3. 上三角矩阵和下三角矩阵:只有主对角线及其以下或以上的元素非零,其他元素都为零。它们在求解线性方程组时非常有用,可以通过高斯消元法将矩阵变换成上三角矩阵或下三角矩阵,从而方便解方程组。 4. 矩形矩阵:一个 $m \times n$ 的矩阵,其中 $m$ 表示行数,$n$ 表示列数。矩形矩阵在很多应用中非常常见,例如用于图像处理、神经网络、数据分析等。 5. 矩阵乘积:对于两个矩阵 $A$ 和 $B$,它们可以相乘得到一个新的矩阵 $C = AB$。矩阵乘积在线性代数中非常重要,可以用于描述复杂的线性变换,例如旋转、缩放、投影等。它也是神经网络中非常重要的运算之一,用于计算隐藏层和输出层之间的连接权重。 这些是线性代数中最基本的矩阵类型和应用,还有其他更高级的矩阵类型和应用,例如奇异值分解、特征分解、广义逆矩阵等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值