25复习课

前面几节讲了几个内容:

  • 正交及投影
  • 行列式
  • 特征值和特征向量
  • 应用:特征值和特征向量

概念

一、正交及投影

首先定义了两个向量正交的概念,然后将这个概念扩展到子空间,最后在四个基本子空间中讨论相互之间的正交性。有了向量、矩阵正交的概念后,接着讨论了向量在直线和平面上投影的表示方法,最后讲了如何利用投影的几何意义来求解一些最优化的问题。核心就是投影矩阵 P P P
P = A ( A T A ) − 1 A P=A(A^TA)^{-1}A P=A(ATA)1A

二、行列式

行列式主要就是在谈论方阵的一个属性,这个属性可以由一个数来表示。前三个性质能够推导出剩下的所有性质,如果可能请记住这些性质:

  • 单位矩阵的行列式为1(性质1)
  • 一次行交换行列式值相反(性质2)
  • 线性提取或者线性展开(性质3)
  • 相同行行列式为0
  • 加减其它行倍数值不变
  • 有零行行列式为零
  • 上三角行列式对角线之积为行列式
  • 奇异矩阵值为零,非奇异不为零
  • 矩阵乘积行列式等于两个矩阵分别行列式后乘积
  • 转置前后行列式不变

接着引出了余子式和代数余子式的概念,结合伴随矩阵给出了求解逆矩阵的一个重要公式:
A − 1 = C T ∣ A ∣ A^{-1}=\frac{C^T}{\vert A \vert} A1=ACT

三、特征值和特征向量

一个方阵一定有特征值和特征向量,满足以下关系:
A x = λ x Ax=\lambda x Ax=λx
将上面的式子转换到我们的方程 A x = 0 Ax=0 Ax=0 上,求解特征值和特征向量就变成了求解方程组的零空间的过程。有了特征向量的概念,就有了特征向量(列)构成的特征向量矩阵 S S S,于是我们多了一种矩阵分解的方法:
A = S Λ S − 1 A=S\Lambda S^{-1} A=SΛS1

四、特征向量和特征值的应用

  • 微分方程
  • 递推公式求解

这一部分和工科联系很紧密,比如说稳定性判断、终值等。

习题

Q1 关于投影

  • 给定向量 a = [ 2 1 2 ] a=\begin{bmatrix}2\\1\\2\end{bmatrix} a= 212 ,求这个向量的投影矩阵 P P P

直接套用公式即可:
P = a a T a T a = 1 9 [ 4 2 4 2 1 2 4 2 4 ] P=\frac{aa^T}{a^Ta}=\frac{1}{9}\begin{bmatrix}4&2&4\\2&1&2\\4&2&4\end{bmatrix} P=aTaaaT=91 424212424
其实,它是一个秩为1的矩阵,矩阵 P P P的列空间向量只有一个,所以其维数为 1 1 1,对应的零空间为 3 − 1 = 2 3-1=2 31=2维。所有其他矩阵都可以通过投影矩阵投影到向量 a a a上,也就是:
P x = λ a Px=\lambda a Px=λa
现在来考察一下特征值的情况,因为特征值是对应零空间的每一个分量,而零空间只有1个分量,所以特征值必有两个0,那么最后一个特征值应该是1,这是因为:
P a = 1 a Pa=1 a Pa=1a
将向量 a a a投影到自身。

还是这个投影矩阵,如果状态向量 u u u满足:
u k + 1 = P u k u 0 = [ 9 9 0 ] u_{k+1}=Pu_k\quad u_0=\begin{bmatrix}9\\9\\0\end{bmatrix} uk+1=Puku0= 990
那么如何求解其通项?

不妨计算一下 u 1 u_1 u1
u 1 = P u 0 = a a T u 0 a T a = a 27 9 = 3 a = [ 6 3 6 ] u_1=Pu_0=a\frac{a^Tu_0}{a^Ta}=a\frac{27}{9}=3a=\begin{bmatrix}6\\3\\6\end{bmatrix} u1=Pu0=aaTaaTu0=a927=3a= 636
因为 P P P是一个投影矩阵,所以有 P k = P P^k=P Pk=P,故通项公式为:
u k = P u 0 u_k=Pu_0 uk=Pu0
假如 P P P是一个普通矩阵,那么就需要利用到特征值和特征向量了:
u 0 = c 1 x 1 + c 2 x 2 + c 3 x 3 u_0=c_1x_1+c_2x_2+c_3x_3 u0=c1x1+c2x2+c3x3

u k = c 1 λ 1 x 1 + c 2 λ 2 x 2 + c 3 λ 3 x 3 u_k=c_1\lambda_1x_1+c_2\lambda_2x_2+c_3\lambda_3x_3 uk=c1λ1x1+c2λ2x2+c3λ3x3

Q2 最小二乘拟合

点坐标如下:

ty
14
25
38

求一条最佳的经过原点的拟合直线方程。设直线方程为:
y = D t y=Dt y=Dt
带入点坐标后:
1 D = 4 2 D = 5 3 D = 8 1D=4\\2D=5\\3D=8 1D=42D=53D=8
写成矩阵形式:
[ 1 2 3 ] D = [ 4 5 8 ] \begin{bmatrix}1\\2\\3\end{bmatrix}D=\begin{bmatrix}4\\5\\8\end{bmatrix} 123 D= 458
显然这个方程是没有解的,转而求其最优解:
A T A D ^ = A T b A^TA\hat{D}=A^Tb ATAD^=ATb
也就是:
D ^ = ( A T A ) − 1 A T b = 38 14 \hat{D}=(A^TA)^{-1}A^Tb=\frac{38}{14} D^=(ATA)1ATb=1438

Q3 施密特正交化

已知向量 a 1 = [ 1 2 3 ] a_1=\begin{bmatrix}1\\2\\3\end{bmatrix} a1= 123 a 2 = [ 1 1 1 ] a_2=\begin{bmatrix}1\\1\\1\end{bmatrix} a2= 111 ,将其变成正交向量组。其实只要知道公式就没有什么难度了。将其中一个向量作为第一个正交向量,这里选择 A 1 = a 1 A1=a_1 A1=a1,所以:
A 2 = a 2 − a 1 T a 2 a 1 T a 1 a 1 = [ 8 14 2 14 − 4 14 ] A2=a_2-\frac{a_1^Ta_2}{a_1^Ta_1}a_1=\begin{bmatrix}\frac{8}{14}\\\frac{2}{14}\\\frac{-4}{14}\end{bmatrix} A2=a2a1Ta1a1Ta2a1= 148142144
所求的正交基为 A 1 A1 A1 A 2 A2 A2组成的向量组。

Q4 特征值与矩阵可逆的关系

特征值全不为0的充要条件是矩阵可逆。假设特征值为零, A x = λ x Ax=\lambda x Ax=λx变成 A x = 0 Ax=0 Ax=0,如果矩阵 A A A可逆,那么特征值为零与特征向量定义矛盾,所以特征值要全不为零。或者你可以直接用矩阵行列式的值等于特征值之积,一旦有一个为0,行列式就会为零,也就是奇异(不可逆的)

除此,矩阵逆的行列式等于特征值之积的倒数。

A + I A+I A+I的迹等于原迹+阶数。

Q5 求有递推矩阵的行列式

矩阵的变化规律如下:
A 4 = [ 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 ] A_4=\begin{bmatrix}1&1&0&0\\1&1&1&0\\0&1&1&1\\0&0&1&1\end{bmatrix} A4= 1100111001110011
OK!基本思路利用代数余子式进行展开,然后再利用特征值求解。设: D n = d e t ( A n ) D_n=det(A_n) Dn=det(An)
D n = ? D n − 1 + ? D n − 2 D_n=?D_{n-1}+?D_{n-2} Dn=?Dn1+?Dn2
按第一行展开,第一个元素的行列式为: D n − 1 D_{n-1} Dn1,第二个元素的行列式为 − D n − 2 -D_{n-2} Dn2,所以:
D n = D n − 1 − D n − 2 D_n=D_{n-1}-D_{n-2} Dn=Dn1Dn2
增加一个方程:
D n − 1 = D n − 1 D_{n-1}=D_{n-1} Dn1=Dn1
两个式子写成矩阵形式:
[ D n D n − 1 ] = [ 1 − 1 1 0 ] [ D n − 1 D n − 2 ] \begin{bmatrix}D_n\\D_{n-1}\end{bmatrix}=\begin{bmatrix}1&-1\\1&0\end{bmatrix}\begin{bmatrix}D_{n-1}\\D_{n-2}\end{bmatrix} [DnDn1]=[1110][Dn1Dn2]
容易求的其特征值为:
λ = 1 ± 3 i 2 \lambda=\frac{1\pm\sqrt{3}i}{2} λ=21±3 i
特征根为负数,且模为1,如果在复平面上表示恰好在单位圆的上下两部分(角度为正负60度位置),用欧拉公式也可以写成指数形式 e π 3 i e^{\frac{\pi}{3}i} e3πi e − π 3 i e^{-\frac{\pi}{3}i} e3πi,这里不进行具体的求解。

那么这个矩阵的稳定性如何?之前的课程里说到指数函数通过特征值 λ \lambda λ是否大于1即可得出矩阵是否稳定,对于虚数暂未讨论,这里的特征根是一个虚数,且其六次方为1,所以是一个既不收敛也不发散的周期函数。

Q6给出下面变化规律的矩阵:
A 4 = [ 0 1 0 0 1 0 2 0 0 2 0 3 0 0 3 0 ] = A 4 T A_4=\begin{bmatrix}0&1&0&0\\1&0&2&0\\0&2&0&3\\0&0&3&0\end{bmatrix}=A_4^T A4= 0100102002030030 =A4T

  • 求投影到 A 3 = [ 0 1 0 1 0 2 0 2 0 ] A_3=\begin{bmatrix}0&1&0\\1&0&2\\0&2&0\end{bmatrix} A3= 010102020 的投影矩阵。
    在前几节的课上, 我们讨论了在直线和平面的投影,他们都可以归结于一个公式:
    P = A ( A T A ) − 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)1AT
    不过对于对直线投影我们有更加特殊的形式( A T A = 1 A T A A^TA=\frac{1}{A^TA} ATA=ATA1),即
    P = A A T A T A P=\frac{AA^T}{A^TA} P=ATAAAT
    对于更加大的空间,也可以使用其一般式子:
    P = A ( A T A ) − 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)1AT
    计算的时候发现没有办法直接通过上述矩阵运算直接求解,因为 A T A A^TA ATA是不可逆的,只能是求更低维度的投影(平面)。也就是 A = [ 0 1 1 0 0 2 ] A=\begin{bmatrix}0&1\\1&0\\0&2\end{bmatrix} A= 010102 .

P = [ 0.2000 0 0.4000 0 1.0000 0 0.4000 0 0.8000 ] P= \begin{bmatrix}0.2000 & 0 & 0.4000\\ 0 & 1.0000 & 0\\0.4000 & 0 & 0.8000\end{bmatrix} P= 0.200000.400001.000000.400000.8000

  • A 3 A_3 A3的特征值和特征向量
    特征值容易题求得为 0 0 0 ± 5 \pm\sqrt{5} ±5 ,特征向量略。

  • 求投影到 A 4 A_4 A4列空间的投影矩阵
    最简单的方法就是套用公式,但是可以更加简单,因为矩阵是可逆的,所以投影矩阵应该是一个单位向量。因为 P = A ( A T A ) − 1 A T = A A − 1 ( A T ) − 1 A T = I P=A(A^TA)^{-1}A^T=AA^{-1}(A^T)^{-1}A^T=I P=A(ATA)1AT=AA1(AT)1AT=I

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值