这些知识是我大一学过的,但是现在有点点不熟练,写篇博文加深一下印象
特征值和特征向量的计算
设 A A A是 n n n阶方阵如果存在常数 λ \lambda λ以及非零 n n n向量 x x x,使得 A x = λ x Ax=\lambda x Ax=λx那么称 λ \lambda λ是矩阵 A A A的特征值, x x x是 A A A属于特征值 λ \lambda λ的特征向量 给定 n n n阶矩阵 A A A,行列式
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 . . . − a 1 n − a 21 λ − a 22 . . . − a 2 n . . . . . . . . . . . . − a n 1 − a n 2 . . . λ − a n n ∣ |\lambda E-A|=\begin{vmatrix} \lambda-a_{11}&-a_{12}&...&-a_{1n}\\ -a_{21}&\lambda-a_{22}&...&-a_{2n}\\ ...&...&...&...\\ -a_{n1}&-a_{n2}&...&\lambda-a_{nn} \end{vmatrix} ∣λE−A∣=∣∣∣∣∣∣∣∣λ−a11−a21...−an1−a12λ−a22...−an2............−a1n−a2n...λ−ann∣∣∣∣∣∣∣∣ 结果是关于 λ \lambda λ的一个多项式,成为矩阵 A A A的特征多项式,该特征多项式构成的方程 ∣ λ E − A ∣ = 0 |\lambda E-A|=0 ∣λE−A∣=0称为矩阵 A A A的特征方程
定理: n n n阶矩阵 A A A的 n n n个特征值就是其特征方程 ∣ λ E − A ∣ = 0 |\lambda E-A|=0 ∣λE−A∣=0的 n n n个解 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn,而 A A A的属于特征值 λ 1 \lambda_1 λ1的特征向量就是其次线性方程 ( λ 1 E − A ) x = 0 (\lambda_1E-A)x=0 (λ1E−A)x=0的非零解
我用iPad写的一个例子:
特征值和特征向量的理解
如果把矩阵的行解释为坐标系的基向量,矩阵与向量相乘(或向量与矩阵相乘)相当于执行一次坐标转换,Ax=y可表述为x经矩阵A变换后变为y。因此,追溯矩阵的由来,与向量的关系,我们会觉得矩阵并不神秘,它只是用一种紧凑的方式来表达坐标转换所需的数学运算。
矩阵A的特征值和特征向量分别为
λ
\lambda
λ和x,
A
x
Ax
Ax可理解为向量x在几何空间中经过矩阵A的变换后得到向量。由此可知,向量x经过矩阵A变换后,方向并无改变(反方向不算方向改变),只是伸缩了
λ
\lambda
λ倍。
在上面的例子中
A
x
1
=
λ
1
x
1
⟹
[
1
−
2
1
4
]
[
2
−
1
]
=
2
[
2
1
]
Ax_1=\lambda_1 x_1\Longrightarrow \begin{bmatrix}1&-2\\1&4\end{bmatrix}\begin{bmatrix}2\\-1\end{bmatrix}=2\begin{bmatrix}2\\1\end{bmatrix}
Ax1=λ1x1⟹[11−24][2−1]=2[21]表示向量
x
1
x_1
x1经过矩阵A,得到
λ
1
x
1
\lambda_1 x_1
λ1x1,向量变换不改变方向,只是将
x
1
x_1
x1在原方向上扩充了2倍。特征值
λ
2
x
2
\lambda_2 x_2
λ2x2也是同样道理,经过矩阵A变换后特征向量
x
2
x_2
x2在原方向上扩充了3倍。
因此,将特征向量看成基向量,矩阵就是这些基向量向对应的特征值伸展所需的数学运算。给定一个矩阵,就可以找出对应的基(特征向量),及透过向量变换(矩阵),这些基的伸展(特征值)。