【从几何角度理解---线性代数Linear algebra】特征向量与特征值

Chluem~Wing

于 2023-03-15 11:43:58 发布

阅读量509

点赞数

分类专栏：线性代数文章标签：线性代数矩阵机器学习考研经验分享

本文链接：https://blog.csdn.net/KeviLi/article/details/129549489

版权

线性代数专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章介绍了线性代数中的特征值和特征向量概念，特别是在二维空间中的应用。特征向量是在线性变换中保持在同一空间的特殊向量，其拉伸或压缩的比例由特征值决定。非对称矩阵可以通过相似对角化求解幂运算，而特征向量构成的基可用于理解矩阵变换的本质。

摘要由CSDN通过智能技术生成

线性代数---特征值与特征向量

二维空间某个线性变换

对于二维空间两个基向量 $\hat i$ 和 $\hat j$ ，发生线性变换之后得到
$\hat i = \begin{bmatrix} 3\\ 0\\ \end{bmatrix}$ 和 $\hat j = \begin{bmatrix} 1\\ 2\\ \end{bmatrix}$
用矩阵来表示 $\begin{bmatrix} 3 & 1\\ 0 & 2 \\ \end{bmatrix}$
若仅仅考虑这个向量张成的原空间（未发生线性变换）
补充：张成（span）：向量空间 $V$ 中的一组向量 $V_1,V_2,...,V_m)$ 的线性组合是如下形式的向量： $a_1v_1 + a_2v_2 + ... + a_mv_m$
若发生线性变换之后，大部分向量都离开了其张成的空间
若发生线性变换之后，某些特殊向量的确留在它们张成的空间里
意味着矩阵对它的作用仅仅是拉伸或者压缩而已，如同一个标量

在本例中

$\hat i$ 张成的空间为x轴， $\begin{bmatrix} 3\\ 0\\ \end{bmatrix}$ 意味着 $\hat i$ 变成了原来的3倍，仍留在在x轴上
因此，在x轴上的任何其他向量都只是被拉伸为原来的3倍，它们也留在了 $\hat i$ 张成空间里
还有一个略显隐蔽的向量 $\begin{bmatrix} -1\\ 1\\ \end{bmatrix}$ ，在变换汇总也留在自己张成的空间里，最终被拉伸为原来的2倍
同上，线性性质暗示着一点，处在它所张成的对角线上的其他任何一个向量，也仅仅倍拉伸为原来的2倍
对于上述矩阵，以上两向量就是拥有这一特殊性质它们张成的空间里）的向量

因此，上述这些特殊向量就被称为变换的“特征向量”

特征值：即衡量特征向量在变换中拉伸或压缩比例的因子

对于特征值的正负问题

特征值为负，意味着这个向量被反向，并压缩为原来的1/2
发生线性变换之后，该向量依旧停留在它张成的直线上，并未发生旋转

3维向量（特征值的用途）

例如，3维物体发生旋转，其中的旋转轴就为其特征向量，且为3维物体张成的空间里的向量，且特征值为1，因为旋转并不缩放任何一个向量，向量长度不变

![[Pasted image 20230314170616.png]]

特征向量在线性变换中的作用

对于任一矩阵描述的线性变换
可以通过将矩阵的列看作变换后的基向量来理解它
但这较少依赖于特定坐标系
最好理解线性变换在于，求出从矩阵变换之后的特征向量和特征值

特征向量的概念与计算

特征向量概念
$A\vec v = \lambda \vec v$
抽象理解：变换矩阵 $A$ 和特征向量 $\vec v$ 乘积，发生线性变换，等价于，特征向量 $\vec v$ 拉伸或压缩了多少倍的特征值 $\lambda$
实际上就是求解使得这个等式成立的向量 $\vec v$ 和数 $\lambda$

如何求解该等式

首先将等号右侧重写为某个矩阵向量乘积（ $\lambda\vec v$ ）
其中，矩阵的作用效果是将任一向量乘以 $\lambda$
这个矩阵的列代表着变换后的基向量，每一个基向量仅仅与 $\lambda$ 相乘
因此该矩阵的对角元均为 $\lambda$ ，其余位置都是0， $\begin{bmatrix} \lambda & 0 & 0\\ 0 & \lambda & 0\\ 0 & 0 & \lambda \end{bmatrix}$

![[Pasted image 20230314181228.png]]

且我们需要一个非零解的 $\vec v$ 特征向量
因此，当且仅当矩阵（括号里）代表的变换将空间压缩到更低的维度时，即行列式为0，可以求出，非零解的特征向量
$det(A-\lambda I) = 0$
补充：求矩阵的行列式的意义为：该矩阵在线性变换过程中，变换前后面积变化比例
当且仅当 $d e t (A) = 0$ 时，矩阵代表的变换将空间压缩到更低的维度

![[Pasted image 20230314182234.png]]

Squishification（空间压缩）等价于 $\lambda I) = 0$
#举例
考虑每个对角元都减去某个变量 $\lambda$
矩阵本身发生改变，因此行列式也在改变
找到一个 $\lambda$ 使得这个行列式为0
使得 $(A-\lambda I) \vec v = \vec 0$ ， $I$ 为单位阵
#几何解释
向量 $\vec v$ 在变换中停留在它张成的空间里
在上述例子中，v对应的特征值为1，实际上保持不变

#公式推导
$A\vec v = \lambda \vec v$
$A\vec v - \lambda \vec v = 0$
$(A-\lambda I)\vec v = \vec 0$
$det(A-\lambda I) = 0$
#举例
![[Pasted image 20230314225838.png]]

将 $\lambda = 2$ 带入矩阵之后，求解线性方程组
$\begin{bmatrix} 1 & 1\\ 0 & 0\\ \end{bmatrix} \begin{bmatrix} x\\ y\\ \end{bmatrix} = \begin{bmatrix} 0\\ 0\\ \end{bmatrix}$
由于， $r (A) = r ([A, B]) = 1$ 该方程组有唯一解，且解为 $\begin{bmatrix} -1\\ 1\\ \end{bmatrix}$ （特征向量）张成的对角线上
相较于原始矩阵，相当于将特征向量拉伸为原来的2倍

二维变换不一定有特征向量

若将原始矩阵旋转90°
一般来说，特征值出现复数的情况，一般对应于变换中的某种旋转

#剪切变换

$\hat i$ 不变，将j帽向右移动一个单位

![[Pasted image 20230314232852.png]]

若将所有向量拉伸为2倍，

特征基

如果我们的基向量恰好是特征向量，除了对角线以外其他元素均为0的矩阵称为对角矩阵，对角线元素进行拉伸或收缩

![[Pasted image 20230315103232.png]]

矩阵的对角线是它们所属的特征值
#性质
相较于非对角矩阵
对于非对角矩阵（非特殊矩阵）
发生线性变换有许多的特征向量，多到能选出一个张成全空间的集合，即为满秩
就能将这些特殊向量作为基

用基变换角度，求解非对称矩阵的幂运算（相似对角化）

#举例

对于矩阵 $\begin{bmatrix} 3 &1\\ 0&2\\ \end{bmatrix}$ ，其特征向量为 $\begin{bmatrix} 1\\ 0\\ \end{bmatrix}$ 和 $\begin{bmatrix} -1\\ 1\\ \end{bmatrix}$
并将其特征向量作为基，作为一个矩阵的列，该矩阵就是基变换矩阵
然后再右侧写下基变换矩阵，左侧学下基变换矩阵的逆，将原始的变换夹在两个矩阵中间
得出相似矩阵概念，设A，B为两个n阶方阵，n阶可逆矩阵P
$P^{-1}AP = B$
称A相似于B，记成A~B
#几何解释
从新基向量所构成的坐标系的角度来看
可逆矩阵P和矩阵P，仅仅把矩阵A的特征向量方向上进行拉伸和收缩，因此一定得出一个对角矩阵B
矩阵A和B，具有相同的特征向量和特征值