特征值和特征向量
A A 是 阶矩阵,如果数 λ λ 和 n n 维非零列向量 使关系式
Ax⃗ =λx⃗ A x → = λ x →成立,那么,这样的数 λ λ 称为矩阵 A A 的特征值,非零向量 称为 A A 的对应于特征值 的特征向量。
以上是特征值和特征向量的定义,根据之前学过的线性变换的知识,我们可以这样解读特征值和特征向量:
- 空间经过线性变换 A A 之后,如果有向量还保持着原来的位置(可反向),即这个向量还留在它自己原来的张成空间里,那么这个向量就是 的特征向量。显然找到一个特征向量,就找到了无数个。向量位置不变,但大小可以变,大小变化的倍数,就是特征值 λ λ 。
如何求解 Ax⃗ =λx⃗ A x → = λ x → ,稍作整理可以得到
注意:
- 不是每个线性变换都有特征值和特征矩阵,比如二维空间旋转90度的变换,每一个向量都离开了原来的位置。通常没有 λ λ 没有实数解表示着某种旋转。
- 同一个特征值可能对应多个向量,比如一个将所有向量拉伸为 2 倍的变换,特征值是2,平面内的每一个向量都是属于这个特征值的特征向量。
特征基
如果基向量都是特征向量,会发生什么?
这意味着所有的基向量都是特征向量,矩阵的对角元是它们所属的特征值,这是个对角矩阵。
对角矩阵定义:除对角线以外其他元素均为0的矩阵被称为对角矩阵。
对角矩阵在很多方面都更加容易处理:
- 如果计算对角矩阵 A A 的 次幂,只需要将每一个对角元 aii a i i 求 n n 次幂,变为 即可。但非对角矩阵就不能这么方便的计算。
如何转化为对角矩阵?
如果一个变换 H H 的所有特征向量,能张成全空间,那么我就可以变换坐标系,使得这些特征向量就是基向量。
方法如下:
首先要再次明确,不是所有矩阵都能对角化,必须满足上面的条件。
将新的基向量,也就是选出来当作基底的特征向量,作为矩阵的列组成一个矩阵,称为基变换矩阵 .
- 那么 A−1HA A − 1 H A 就是在 A A 空间的语言下描述的 变换。而且 A−1HA A − 1 H A 一定是一个对角矩阵,对角元是特征值。之所以是对角矩阵,是因为我们是以位置不变的特征向量来构造 A A 的,所以 这个变换在 A A 空间看来,只是让 的基向量进行了缩放而已。
- 这样就得到了对角矩阵,可以在运算完之后再换回原空间的表述。
一组基向量(同样是特征向量)构成的集合被称为一个“特征基”。