特征值和特征向量的理解浅显易懂肯定有收获

最新推荐文章于 2021-10-22 17:06:09 发布

irober

最新推荐文章于 2021-10-22 17:06:09 发布

阅读量8.7k

点赞数 12

分类专栏：线性代数与矩阵文章标签：线性代数矩阵

原文链接：https://blog.csdn.net/ljhandlwt/article/details/76576915

版权

线性代数与矩阵专栏收录该内容

11 篇文章 4 订阅

订阅专栏

特征值和特征向量的理解

前言
一、矩阵是什么？
二、举个例子
- 1、计算特征值与特征向量
- 2、用特征向量表示任意向量
三、理解其他结论

前言

本文将探讨线性代数中及其重要的两个概念:特征值与特征向量.

提示：(PS:下文中的矩阵A均认为是方阵) 。

一、矩阵是什么？

矩阵不单单是二维数组，它更重要的角色是映射： $\vec{y}=A\vec{x}$
$\vec{y}=A\vec{x}$ 就相当于 $\vec{y}=f(\vec{x})$ ,矩阵A是把向量 $\vec{x}$ 映射到向量 $\vec{y}$ 的一个函数,或者说,映射,算子。

从一般的角度看,这个映射无非就是矩阵乘向量,说得具体一点,就是n次的向量点积计算.(矩阵的一行乘上向量,并对结果向量的所有元素求和,就是一次点积)

错!实际上,这个映射本质是一个缩放操作.

二、举个例子

1、计算特征值与特征向量

提示：可以动动手指头算一算，参考这里。

举一个简单的例子,矩阵 $\left( \begin{array}{ccc} 4 & -2 \\ 3 & -1 \end{array} \right)$
它的特征值分别是2和1,特征向量是 $\left( \begin{array}{ccc} 1 \\ 1 \end{array} \right)$ 和 $\left( \begin{array}{ccc} 2 \\ 3 \end{array} \right)$

2、用特征向量表示任意向量

我们随便设向量 $\vec{x}=\left( \begin{array}{ccc} 1 \\ 2 \end{array} \right)$ ，显然结果 $\vec{y}=A\vec{x}=\left( \begin{array}{ccc} 0 \\ 1 \end{array} \right)$

我们使用另一种方法计算,首先我们将 $\vec{x}$ 表示成特征向量 $\left(\begin{array}{ccc} 1 \\ 1 \end{array} \right)$ 和 $\left( \begin{array}{ccc} 2 \\ 3 \end{array} \right)$ 的线性组合，即：
$\vec{x}=\left( \begin{array}{ccc}1\\2\end{array} \right)=-1*\left( \begin{array}{ccc}1\\1\end{array} \right) + 1* \left( \begin{array}{ccc}2\\3\end{array} \right)$
然后,我们将特征值和对应的系数相乘,得到:
$\vec{y}=-1*2*\left( \begin{array}{ccc}1\\1\end{array} \right) + 1*1* \left( \begin{array}{ccc}2\\3\end{array} \right)=-2*\left( \begin{array}{ccc}1\\1\end{array} \right) + 1* \left( \begin{array}{ccc}2\\3\end{array} \right)$
显然,如果你继续计算下去,你也会得到 $\vec{y}=\left( \begin{array}{ccc}0\\1\end{array} \right)$
提示：好好领悟

特征值和特征向量的意义就在于此!
矩阵所充当的映射,实际上就是对特征向量的缩放,每个特征向量的缩放程度就是特征值.
因此,我们需要将向量 $\vec{x}$ 表示成特征向量的线性组合(相当于以特征向量为基),得到相应的特征向量的权重.

然后,每个权重与特征值相乘,就是这个映射最本质的缩放操作.

三、理解其他结论

基于这样的理解,我们可以很简单地解释很多结论。

1、对角化分解

对角化分解实际上就是我们解释特征值含义的过程。
$A=P\Lambda P^{-1}$ ,其中 $P$ 是由特征向量组成的矩阵, $Λ$ 是由特征值组成的对角矩阵。

在解释对角化分解之前,我们还要先解释矩阵的另一个含义.
对于 $\vec{z}=P\vec{y}$ , 事实上矩阵P还有其他含义,比如在这里有转换基向量的含义:

$\vec{y}$ 是特征向量为基所表示的向量，上文 $\vec{y}=-2*\left( \begin{array}{ccc}1\\1\end{array} \right) + 1* \left( \begin{array}{ccc}2\\3\end{array} \right)$ ，那么 $\vec{y}$ 在在特征向量为基的表示是 $\vec{y}=\left( \begin{array}{ccc}-2\\1\end{array} \right)$
$\vec{z}$ 则是坐标轴为基所表示的向量,假如 $\vec{z}$ 的表示为 $\vec{z}=\left( \begin{array}{ccc}0\\1\end{array} \right)$ ，相当于 $\vec{z}=0*\left( \begin{array}{ccc}1\\0\end{array} \right) + 1* \left( \begin{array}{ccc}0\\1\end{array} \right)$
那么 $\vec{z}=P\vec{y}$ 的含义就是把一个向量从特征向量为基的表示 $\vec{y}$ ,转变成以坐标轴为基的表示 $\vec{z}$ .
相应, $\vec{y}=P^{-1}\vec{x}$ 的含义则相反,是把一个向量从坐标轴为基的表示 $\vec{x}$ ,转变成以特征向量为基的表示 $\vec{y}$ .

那么 $\vec{y}=A\vec{x}=P\Lambda P^{-1} \vec{x}$ ，我们就可以解释了。
首先, $P^{-1}\vec{x}$ 是将 $\vec{x}$ 转变成用特征向量表示,上文 $\vec{x}=\left( \begin{array}{ccc}1\\2\end{array} \right)=-1*\left( \begin{array}{ccc}1\\1\end{array} \right) + 1* \left( \begin{array}{ccc}2\\3\end{array} \right)$ ，就是把 $\left( \begin{array}{ccc} 1 \\ 2 \end{array} \right)$ 变成了 $\left( \begin{array}{ccc} -1 \\ 1 \end{array} \right)$ 。
然后 $\Lambda P^{-1} \vec{x}$ ,就是对应的特征值与权重作乘法,得到 $\left( \begin{array}{ccc} -2 \\ 1\end{array} \right)$ 。
最后 $\vec{y}=P\Lambda P^{-1} \vec{x}$ ，就是把 $\left( \begin{array}{ccc} -2 \\ 1\end{array} \right)$ 重新转换成坐标轴为基的表示,得到 $\left( \begin{array}{ccc} 0 \\ 1\end{array} \right)$ 。

2、矩阵的特征值分别是原矩阵特征值的倒数

是因为原矩阵放大了2倍,逆矩阵就要相应地缩小到原本的1/2.

当然,特征向量要保持对应,因此这也解释了为什么逆矩阵的特征向量和原矩阵一样

3、特征值为0,意味着不可逆

参考第2点,0没有倒数.

4、通过解 $A\vec{x}=\lambda \vec{x}$ 来寻找特征值

显然,在这里λ是特征值, $\vec{x}$ 是特征向量.

把 $\vec{x}$ 变成以A的特征向量为基来表示的话,那么权重肯定只有1个1,其他都为0,那个1对应的特征向量当然是 $\vec{x}$ 本身.

这个时候进行缩放,那么只有 $\vec{x}$ 的权重被缩放了,其他特征向量的权重都是0,0乘任何数为0.

那么,A $\vec{x}$ 的结果就相当于 $\lambda\vec{x}$ 了,因为 $\lambda\vec{x}$ 就是 $\vec{x}$ 作了相应的缩放,缩放因子就是特征值λ.

irober

关注

12
点赞
踩
74

收藏

觉得还不错? 一键收藏
1
评论
特征值和特征向量的理解浅显易懂肯定有收获

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档特征值和特征向量的理解前言一、矩阵是什么？二、举个例子1、计算特征值与特征向量2、用特征向量表示任意向量三、理解其他结论1、对角化分解2、矩阵的特征值分别是原矩阵特征值的倒数3、特征值为0,意味着不可逆4、通过解Ax⃗=λx⃗A\vec{x}=\lambda \vec{x}Ax=λx来寻找特征值前言本文将探讨线性代数中及其重要的两个概念:特征值与特征向量.提示：(PS:下文中的矩阵A均认为是方阵) 。一、矩阵是什么？矩阵不单单
复制链接

扫一扫