上一次演讲中我问到:“数学对你来说意味着什么?”有的人回答:“处理数字,处理结构”,“那么如果我问你音乐对于你来说意味着什么,你会回答“处理音符吗”? ——塞尔日·兰
变换中被留在张成空间内的向量,就是特征向量(上例x轴和
(
−
1
,
1
)
(-1,1)
(−1,1))。
其中每个向量被拉伸或抽缩的比例因子,就是特征值(上例3和2)。
正负表示变换的过程中是否切翻转了方向。
从计算角度来看特征值和特征向量,里面包含了很多对以前只是回顾和整合。
- 根据特征向量和特征值的定义,使用数学的方法来表示即
A v ⃗ = λ v ⃗ \mathbf A \mathbf{\vec v} = \lambda \mathbf{\vec v} Av=λv
A \mathbf A A 是求特征值和特征向量的变换矩阵; v ⃗ \mathbf{\vec v} v 是特征向量; λ \lambda λ 是特征值;目标是找 v ⃗ \mathbf{\vec v} v 和 λ \lambda λ
至于为何会用这个式子来定义特征向量和特征值呢,我们继续观察这个式子中的
λ
v
⃗
\lambda \mathbf{\vec v}
λv ,考虑到右边是一个矩阵乘法,我们希望左右都是一个矩阵乘法,这样方便等价和计算。观察发现,
λ
v
⃗
\lambda \mathbf{\vec v}
λv 就是给
v
⃗
\mathbf{\vec v}
v 中每一个元素都乘以
λ
\lambda
λ 。对角矩阵
I
\mathbf I
I 且对角线元素为
λ
\lambda
λ 的矩阵也能有同样的变换结果,得到下列表达式
A
v
⃗
=
(
λ
I
)
v
⃗
⟹
(
A
−
λ
I
)
v
⃗
=
0
\mathbf A \mathbf{\vec v} = (\lambda \mathbf I ) \mathbf{\vec v} \implies (\mathbf A - \lambda \mathbf I ) \mathbf{\vec v} = 0
Av=(λI)v⟹(A−λI)v=0
观察这个等式你会发现:可以把
A
−
λ
I
\mathbf A - \lambda \mathbf I
A−λI 矩阵看成一个对
v
⃗
\mathbf{\vec v}
v 矩阵的变换,目的是把
v
⃗
\mathbf{\vec v}
v 压缩到更低的维度。而空间压缩对应的恰好就是变换矩阵的行列式为0
特征向量的特殊情况
旋转变换
解出特征值能发现答案是
±
i
\pm i
±i ,没有特征向量存在,即特征值出现复数的情况一般对应于变换中的某种旋转。
剪切变换
Shear变换。x轴不变,只有一个特征值,为1(
(
λ
−
1
)
2
=
0
(\lambda-1)^2=0
(λ−1)2=0)
伸缩变换
特征值只有一个,但是是空间中所有的向量都是特征向量。
特征基
对角矩阵:只有对角线非零的矩阵。解读它的方法是:所有的基向量都是特征向量。因为之前提到过,矩阵的第一列是
ı
^
\hat {\imath}
ı^ ,第二列是
ȷ
^
\hat {\jmath}
ȷ^ ,往后同理。这样就能发现,如果一列只有对应的位置非零,那么这个坐标轴本身就就是特征向量。
一组基向量(同样是特征向量)构成的集合被称为一组:特征基
对角矩阵有一个好处是计算方便,多次矩阵乘法非常容易,这时我们就希望利用对角矩阵(基向量为特征向量)的便于计算的特性,利用上一节提到的基向量变换的方法,把特征向量作为基,对每一个矩阵进行变换后再进行计算,最后再左乘变换矩阵的逆求回原矩阵得到结果。
但需要说明的是,并不是所有的矩阵都能对角化,比如Shear变换,它的特征向量不够多,不足以张成一个空间。