10 特征向量和特征值
【熟肉】线性代数的本质 - 10 - 特征向量与特征值_哔哩哔哩 (゜-゜)つロ 干杯~-bilibiliwww.bilibili.com理解特征值和特征向量,需要对之前的很多概念有几何直观的理解,包括线性变换、行列式、线性方程组和基变换。对特征值和特征向量理解偏弱的原因,往往是对以上概念并不清楚。
二维空间中的一个线性变换将基向量i 变换为
在本例中,向量i 所在的方向就是这样一个特殊的方向,它张成的空间是x轴。矩阵对它的线性变换作用,使得向量i 变成了原来的三倍,但仍然在x轴上。x轴上的其他向量也都只是被拉伸为原来的三倍。
另一个略显隐蔽的向量是
以上就是所有拥有“留在自己张成的空间”这个性质的特殊向量。其他的向量,在变换中都有或多或少的旋转。
这些向量就被称为这个线性变换的特征向量,衡量特征向量在变换中拉伸或压缩的比例因子就是它对应的特征值。如果特征向量为负值,比如-1/2,意味着这个向量被反向,并且压缩到原来的1/2。但它仍旧停留在自身张成的直线上,没有发生旋转。
考虑一个三维空间中的旋转变换。如果能找到该变换的特征向量,那你找到的就是旋转轴。把一个三维旋转看成绕某个轴旋转一定角度,比考虑相应的3×3矩阵直观得多。在这种旋转变换中,特征值为1,因为空间只发生旋转,并不发生拉伸和压缩。
线性变换对应的矩阵,其列向量就是基向量变换后的坐标。但是理解线性变换作用的关键,往往较少依赖于特定的坐标系。最好的方法是求出它的特征向量和特征值。
矩阵、特征向量和特征值的关系为Av=λv,A是矩阵,v是特征向量,λ是该特征向量对应的特征值。特征向量经过矩阵变换后方向不变但被伸缩了λ倍。求解特征值和特征向量就是求解满足于上式的解。
Av=(λI )v
Av-(λI )v=0
(A-λI )v=0
得到了一个新的矩阵A-λI,我们的目标变成寻找一个非零的向量v,使得这个新矩阵与之相乘的结果为零向量。当且仅当这个新矩阵所代表的线性变换将空间压缩到更低维度的时候,这个方程有非零解。而这个矩阵所对应的行列式等于0。求解的过程就变为找到一个λ使得行列式det(A-λI )=0。
例如前面提到的矩阵
二维线性变换不一定有特征值,比如90度逆时针旋转变换,所有的向量都发生了旋转,没有向量能够保持在其张成空间。逆时针旋转对应矩阵为
与虚数i相乘在复平面代表着90度旋转。这里可以看看另一篇笔记的部分内容。 我们从虚数i开始说起,如果你只把它解释为-1的平方根,是对理解和应用没有太大帮助的,因为这只是定义而已。对于负数而言,我们可以将乘以-1当成一种操作,操作的结果就是在实轴上实现“反向”,如果乘以,就是连续进行两次"反向"操作,则变换回原位置。从这种解释出发,如果存在一个数,它的平方等于-1,则代表着经过两次操作,可以实现“反向”,因此可以想到的几何解释就是旋转90度(是逆时针旋转,为顺时针旋转)。经过两次90度旋转就会实现反向,其数学表达就是。
更多关于复数和欧拉公式的内容,可以参考这篇笔记:
三少爷的贱男春:G.Strang的微分方程和线性代数(1.3)
剪切变换对应的矩阵为
有时候只有一个特征值,但特征向量不止在一条直线上。例如,拉伸变换
如果基向量是特征向量会发生什么?
比如,向量i变换变为原来的(-1)倍,而向量j变为原来的两倍,则变换对应的矩阵是
除了对角元素,其它元素均为0的矩阵被称为对角阵。对于对角阵,所有的基向量就是其特征向量,而对角元素就是它们所属的特征值。对角阵有很多特点,例如矩阵方幂很容易计算,
如果矩阵的特征向量足够多,可以张成整个空间,那么可以通过变换坐标系,使得这些特征向量成为基向量。
矩阵
这样做的意义在于,这个矩阵会是对角阵,且对角元就是对应的特征值。
它所处的坐标系的基向量在该线性变换中只进行了缩放。
一组特征向量构成的基向量的集合,称为一组“特征基”。计算矩阵
并不是所有的变换都可以完成以上过程,例如剪切变换,它的特征向量不够多,不能张成整个空间。