【线性代数及其应用】07 - 特征值与特征向量

最新推荐文章于 2024-02-29 11:07:11 发布

Ciaran-byte

最新推荐文章于 2024-02-29 11:07:11 发布

阅读量1.3k

点赞数 2

分类专栏：数学基础文章标签：线性代数

本文链接：https://blog.csdn.net/qq_41741344/article/details/107697541

版权

数学基础专栏收录该内容

46 篇文章 75 订阅

订阅专栏

特征值与特征向量

1. 特征值

1.1 什么是特征值

有些矩阵对向量的线性变换是只改变其大小，而不改变向量的方向，这种向量叫做矩阵的特征向量，而改变的大小叫做特征值。也就是
$A*v_1 = λ*v_1$
v1叫做特征向量，λ叫做特征值

1.2 特征值的求解方法

$A * V = λ * V$

$(A - λ * I) * v = 0$

$即求 d e t (A - λ * I) = 0$

1.3 特征方程

$(A - λ * I) * v = 0$

1.4 特征向量的求解方法

特征向量就是求特征方程的零空间

1.5 特征值、特征向量与矩阵之间的关系

假设A的特征值是λ，A的特征向量是v，则A+nI的特征向量是λ+n，特征向量不变

1.6 对称性与特征值之间的关系

如果矩阵是对称的，那么特征值都是实根，如果矩阵是旋转矩阵样式的完全不对称的，特征值全部是虚根。对称性越高，实根比例越高。

2.特征值的应用

2.1 对角化分解

2.1.1 含义

对角分解是基于特征值和特征向量的矩阵分解
我们知道，特征值具有这样的性质
$A*v_1 = λ_1*v1$
v1是矩阵A的特征向量，λ1是矩阵A的特征值。如果有矩阵S是矩阵A的特征向量的合集
$A*\left\{\begin{matrix}v1& ...&vn \end{matrix}\right\} =\left\{\begin{matrix}λ1*v1& ...&λn*vn \end{matrix}\right\}=S*λ$

$*\left\{\begin{matrix}λ1& ...&0\\...&λr&...\\0&...&λn \end{matrix}\right\}$

可得
$A = S^{-1}*λ*S$

2.1.2 分解条件

可以看出来，只有A有n个线性无关的特征向量的时候，才能对角化，如果有n个不同的特征值，必定有n个线性无关的特征向量，但是没有n个不同的特征值，不一定不能进行对角化分解

2.1.3 分解方法

分解方法就是，只要能够求得特征值和特征向量即可构造矩阵S和λ
先求特征值
$A * v = λ * v$

$（ A - λ * I ） * v = 0$

$求 d e t ∣ A - λ * I ∣ = 0 即可解得特征值$
再求特征向量
$求得的特征值代入（ A - λ * I ） * v = 0$
求解其零空间即可获得特征向量。如果λ是重根，就看看重根能否在零空间内得到足够的特征向量，否则不能对角化

有了特征值和特征向量即可实现对角化

2.2 A的幂次运算

特征值和对角化的一个非常重要的应用是求矩阵A的幂次
$A = S*λ*S^{-1}$

$A^2 = S*λ*S^{-1}* S*λ*S^{-1}=S*λ^2*S^{-1}$

$λ^2 = \left\{\begin{matrix}σ_1^2&...&0\\...&σ_r^2&...\\0&...&σ_n^2\end{matrix}\right\}$
通过这种方式，利用特征值，可以非常方便的求A的高阶幂次
$A^n = (S*λ*S^{-1})^n=S*λ^n*S^{-1}$

2.3 差分方程

2.3.1 一阶差分方程

一般来说差分方程对应着幂矩阵的应用(A^k)，微分方程对应着指数矩阵的应用(e^Ak)。
一阶差分方程写作
$X_{k+1}= A*X_k = AX_k=A^k*X_0$
求解差分方程与A的幂次就有关系了，具体求解方法见2.3.3

2.3.2 高阶差分方程

高阶差分方程是指带有多阶未知数的方程，一般需要增加一个恒等式，配成一阶差分方程

比如：求解斐波那契数列
$X_{k+1} = X_k + X_{k-1}$

引入恒等式
$X_k = X_k$

变量代换
$Y_{k+1} = \left\{\begin{matrix}X_{k+1}\\X_k\end{matrix}\right\}$
$Y_{k} = \left\{\begin{matrix}X_{k}\\X_{k-1}\end{matrix}\right\}$

则
$Y_{k+1} = A*Y{k}= \left\{\begin{matrix}1&1\\1&0\end{matrix}\right\}*Yk$

2.3.3 差分方程的用处

特征值在差分方程中，可以用于描述一个系统的迭代的终态，或者描述稳定性问题。

比如
$X_{k+1}=AX_k=A^k*X_0$
这个方程可以用于描述人口迁移、生物演化、运行系统等。

如果A可以进行对角化，那么必定有n个特征向量，将X0分解为特征向量的线性组合

$X 0 = c 1 * v 1 + c 2 * v 2 + . . . + c n * v n$
由于A可以对角化
$A*\{v_1,v_2,v_3...,v_n\}=\{v_1,v_2,...v_n\}*λ$
A的幂次乘以特征向量得到
$A^2*v_1 = A*A*v_1 = A*λ_1*v_1 = λ_1*A*v_1 = λ_1^2*v_1$
所以，迭代方程可以表示为
$X_k = c_1*λ_1^k*v_1+...+c_n*λ_n^k*v_n$
会有这些情况

如果有一个特征值为1，其他特征值全部小于1，最终系统会达到稳定状态，也就是特征值1的那个特征向量
如果全部特征值都小于1，系统最终会退化，向量结果会全部趋近0。原点被称为吸引子
如果特征值全部都大于1，系统最终会发散，向量结果全部趋于无穷大。向量会远离原点。这个时候原点称为排斥子
如果部分特征值大于1，部分特征值小于1，向量的某些方向会趋近于原点，某些方向会远离原点，结果依然发散。原点被称为鞍点
如果特征值部分含有虚数，必定具有旋转分量。如果v1和v2的共轭特征值的模大于1，会在v1和v2平面上远离原点旋转。如果共轭特征值的模小于1，会在v1和v2平面上靠近原点旋转。如果模等于1，就是圆旋转

2.4 求解微分方程

2.4.1 微分方程的求解

$X^{'} (t) = A * X (t)$
回忆差分方程的求解是先找到了方程的特解X0，然后将特解用特征向量进行分解，Xk就是特征值与特征向量乘积的组合了
$X(0)=c_1*v_1+...+c_n*v_n$

$X(k)=c1*λ_1^k*_1+....+cn*λ_k^k*v_n$
在微分方程中，其实就是用特征值的指数替换了特征值的幂次而已
$X(0)=c_1*v_1+...+c_n*v_n$

$X(t)=c1*e^{λ_1*t}+....+cn*e^{λ_k*t}*v_n$

2.4.2 微分方程的稳态

与差分方程一样，微分方程也有稳态稳态。

如果有一个特征值为0，其余特征值小于0，则X(t)中当t趋近于无穷时，结果是一个稳态
如果特征值全部大于1，X(t)是发散的，值趋于无穷，零点是一个排斥子
如果特征值全部小于1，X(t)是退化的，值趋于0，零点是一个吸引子
如果有的特征值大于0，有的特征值小于0，零点是一个鞍点

因为特征值之和等于矩阵的迹，特征值之积等于矩阵的行列式值，对于2x2矩阵的稳定性判断，我们希望结果是收敛的，必有特征值都小于0，所以有如下判据
$t r a c e (A) < 0$

$d e t (A) > 0$

2.4.3 解耦合

如果能够把X(t)中全部的变量单独分解开来，一个方程中都是自己的导数，就是一种解耦合。只要把系数矩阵A变成λ，就保证了每个变量的导数都只和自己有关，即实现了解耦合。使用特征向量可以实现解耦合。

解耦合的作用是在原来混杂的微分方程中，分解出构成他们的独立的变量。找到了各个独立分量之后，原来的耦合的变量，就是根据特征向量重新组合的结果。

在差分方程中，做的是对X0变成特征向量的线性次数的重新组合；在微分方程中，利用解耦得到独立变量，做的是X(t)变成特征向量的函数次数的重新组合。

（1）变量代换

使用特征向量S来进行解耦合
$令 X (t) = S * Y (t)$

$其中S=\{v_1,v_2,v_3.....,v_n\}$
把X替换后可以得到
$S * Y^{'} (t) = A * S * Y (t)$

（2）解耦合

下面求解函数Y(t)我们知道
$A = S*λ*S^{-1}$
可以得到
$S * Y^{'} (t) = S * λ * Y (t)$

两边同时乘以S^-1,实现了微分方程的解耦
$Y^{'} (t) = λ * Y (t)$

$\left\{ \begin{matrix} y_1'(t)\\ .....\\ y_n'(t) \end{matrix} \right\} =\left\{ \begin{matrix} λ_1 & ... & 0 \\ ... & ... & ... \\ 0 & ... & λ_n \end{matrix} \right\} *\left\{ \begin{matrix} y_1(t)\\ .....\\ y_n(t) \end{matrix} \right\}$

解得Y(t)
$\left\{ \begin{matrix} c1*e^{λ1*t}\\ .....\\ cn*e^{λn*t} \end{matrix} \right\}$

(3)使用解耦合结果可以验证微分方程特征值公式

原来的变量x其实就是y的解耦合微分方程组的线性组合。Y(t)其实可以理解为X(t)在各个特征向量方向上的分量
$X(t)=S*Y(t)=c1*e^{λ1*t}*v1+....+cn*e^{λn*t}*vn$

2.4.4 指数矩阵的意义

如果保留了矩阵求解微分方程可以得到一个指数矩阵
$X^{'} (t) = A * X (t)$

$X(t)=e^{A*t}*X(0)$

如果通过特征向量拆解为解耦合微分方程组
$Y^{'} (t) = λ * Y (t)$

$Y(t)=e^{λ*t}*Y(0)$

$X(t)=S*Y(t)=S*e^{λ*t}*S^{-1}*X(0)$
如何理解这个指数矩阵呢？这个可以用个泰勒公式展开进行进一步表达
$e^{A*t}=I+A*t+\frac{(A*t)^2}{2}+....+\frac{(A*t)^n}{n!}$
如果用SλS^-1代替A
$e^{A*t}=I+S*λ*S^{-1}+....+\frac{S*λ^n*S^{-1}*t^n}{n!}=S*e^λ*S^{-1}$

2.4.5 求解二阶微分方程的原理和方法

二阶微分方程与二阶差分方程类似，也可以通过配一个恒等式的方法，把二阶微分方程变成一阶的微分方程

2.5 马尔科夫链与稳态

2.5.1 马尔科夫矩阵

马尔科夫矩阵是一种求解演化问题的概率矩阵，比如每年城市人口和乡村人口都会发生变迁，城市人口有10%的流入农村，而农村人口会有20%流入城市，则可以构建下列的迁入迁出矩阵
$T=\left\{\begin{matrix}0.1&0.8\\0.9&0.2\end{matrix}\right\}$
具有以下特征

所有元素必定大于0
所有列的和都为1
1必定是马尔科夫矩阵的一个特征值，其余都小于1

$A-λI=\left\{\begin{matrix}a11-λ&a12\\a21&a22-λ\end{matrix}\right\}$
把所有数都加到最后一列
$A-λI=\left\{\begin{matrix}a11-λ&a12\\a21+a11-λ&a12+a22-λ\end{matrix}\right\}$
由各列之和为1可得
$A-λI=\left\{\begin{matrix}a11-λ&a12\\1-λ&1-λ\end{matrix}\right\}$
λ=1时有一行为0，必定使得行列式值为0，所以λ是一个特征值

2.5.2 稳态

延续上面的人口迁移问题,若第一年城市人口x1，农村人口x2，第二年呢?

$x 1^{'} = 0.9 * x 1 + 0.2 * x 2$

$x 2^{'} = 0.1 * x 1 + 0.8 * x 2$

可以写作差分方程

$X_2 = T*X_1$
n年之后的人口为
$X_n = T^n*X_1$

所以差分方程对角化展开式可以写作
$X_n = c_1*λ_1^n*v_1+...+c_k*λ_k^n*v_k$
因为其中一个特征值为1，其余所有特征值小于1，所以随着时间推移，最终人口总数会趋于恒定，是一个常量

Ciaran-byte

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【线性代数及其应用】07 - 特征值与特征向量

特征值与特征向量文章目录特征值与特征向量1. 特征值1.1 什么是特征值1.2 特征值的求解方法1.3 特征方程1.4 特征向量的求解方法1.5 特征值、特征向量与矩阵之间的关系1.6 对称性与特征值之间的关系2.特征值的应用2.1 对角化分解2.1.1 含义2.1.2 分解条件2.1.3 分解方法2.2 A的幂次运算2.3 差分方程2.3.1 一阶差分方程2.3.2 高阶差分方程2.3.3 差分方程的用处2.4 求解微分方程2.4.1 微分方程的求解2.4.2 微分方程的稳态2.4.3 解耦合（1）变量
复制链接

扫一扫