上半年研究生复试面试问的印象最深刻的题目就是:请根据自己的理解解释一下特征值与特征向量。
那种无从下嘴的感觉至今记忆犹新。
我们大学学线性代数、现代控制理论以及线性系统时都会学到特征值与特征向量,而且也仅限于会做题而已,却根本不知道他们是怎么来的。本文就深度梳理一下特征值与特征向量及其几何意义。
1.特征值与特征向量
我们知道,矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。
实际上,上述的一段话既讲了矩阵变换特征值及特征向量的几何意义(图形变换)也讲了其物理含义。物理的含义就是运动的图景:特征向量在一个矩阵的作用下作伸缩运动,伸缩的幅度由特征值确定。特征值大于1,所有属于此特征值的特征向量身形暴长;特征值大于0小于1,特征向量身形猛缩;特征值小于0,特征向量缩过了界,反方向到0点那边去了。
我们来看个例子:
M = ( 3 0 0 1 ) M=\left( \begin{array}{lcr} 3 & 0 \\ 0 & 1 \\ \end{array} \right) M=(300<