观看B站视频【工程数学基础】1_特征值与特征向量所作的笔记。
1.特征值与特征向量
对于一个给定的线性变换
A
\color{blue}A
A,它的特征向量
v
\color{blue}v
v 经过这个线性变换的作用之后,得到的新向量仍然与原来的
v
\color{blue}v
v 保持在同一直线上,但是其长度或方向也许会改变,即:
A
v
=
λ
v
(1)
\color{blue}Av=\lambda v \tag{1}
Av=λv(1)
其中,
λ
\color{blue}\lambda
λ是标量,即特征向量的长度在该线性变换下缩放的比例,称其为
特
征
值
\color{red}特征值
特征值。
A
v
=
λ
v
\color{blue}Av=\lambda v
Av=λv
等价于:
(
A
−
λ
I
)
v
=
0
(2)
\color{blue}(A-\lambda I )v=0 \tag{2}
(A−λI)v=0(2)
根据矩阵的理论,如果要使上面的等式有非零解,必须满足:
∣
A
−
λ
I
∣
=
0
(3)
\color{blue}|A-\lambda I |=0 \tag{3}
∣A−λI∣=0(3)
解出上式就得到了特征值
λ
\color{blue}\lambda
λ 和特征向量
v
\color{blue}v
v。
2.矩阵特征值与特征向量的一个重要的应用就是:把矩阵化为对角矩阵,它起到一个解耦的作用。
例子:
A
=
[
1
1
4
−
2
]
A=\begin{bmatrix}1&1\\ 4 & -2\\ \end{bmatrix}
A=[141−2]
可以求得矩阵
A
A
A的的特征值为
λ
1
=
2
\lambda_1=2
λ1=2,
λ
2
=
−
3
\lambda_2=-3
λ2=−3
对应的特征向量分别为:
v 1 = [ v 11 v 12 ] = [ 1 1 ] v1=\begin{bmatrix} v11\\v12\\ \end{bmatrix}=\begin{bmatrix} 1\\1\\ \end{bmatrix} v1=[v11v12]=[11] 和 v 2 = [ v 21 v 22 ] = [ 1 − 4 ] v2=\begin{bmatrix} v21\\v22\\ \end{bmatrix}=\begin{bmatrix} 1\\-4\\ \end{bmatrix} v2=[v21v22]=[1−4] 。
P = [ v 1 v 2 ] \color{blue}P=\begin{bmatrix} v1\ v2\\ \end{bmatrix} P=[v1 v2]是一个过滤矩阵,那么:
A P = A [ v 1 v 2 ] = A [ v 11 v 21 v 12 v 22 ] = [ A [ v 11 v 12 ] A [ v 21 v 22 ] ] = [ λ 1 [ v 11 v 12 ] λ 2 [ v 21 v 22 ] ] = [ λ 1 v 11 λ 2 v 21 λ 1 v 12 λ 2 v 22 ] = [ v 11 v 21 v 12 v 22 ] [ λ 1 0 0 λ 2 ] = P Λ \quad AP \\\quad\\ = A\begin{bmatrix} v1\ \quad v2\\ \end{bmatrix} \\\quad\\ =A\begin{bmatrix} v11&v21\\ v12 & v22\\ \end{bmatrix} \\\quad\\ = \begin{bmatrix} A\begin{bmatrix}v11\\v12 \end{bmatrix} \quad A \begin{bmatrix}v21 \\ v22\\ \end{bmatrix}\end{bmatrix} \\\quad\\ = \begin{bmatrix} \lambda_1\begin{bmatrix}v11\\v12 \end{bmatrix} \quad \lambda_2\begin{bmatrix}v21 \\ v22\\ \end{bmatrix}\end{bmatrix} \\\quad\\ =\begin{bmatrix} \lambda_1 v11& \lambda_2v21\\ \lambda_1v12 & \lambda_2v22\\ \end{bmatrix} \\\quad\\ =\begin{bmatrix} v11&v21\\ v12 & v22\\ \end{bmatrix} \begin{bmatrix} \lambda_1&0\\ 0 & \lambda_2\\ \end{bmatrix} \\\quad\\ =P \Lambda AP=A[v1 v2]=A[v11v12v21v22]=[A[v11v12]A[v21v22]]=[λ1[v11v12]λ2[v21v22]]=[λ1v11λ1v12λ2v21λ2v22]=[v11v12v21v22][λ100λ2]=PΛ
这样就得到了:
A
P
=
P
Λ
(4)
\color{blue}AP=P \Lambda \tag{4}
AP=PΛ(4)
等式都左乘
P
−
1
\color{blue}P^{-1}
P−1,得到:
P
−
1
A
P
=
Λ
(5)
\color{blue}P^{-1}AP= \Lambda \tag{5}
P−1AP=Λ(5)
3.在控制理论的状态空间中的运用:
在现代控制理论当中,状态空间的方程,是由一些微分方程组组成的。
{
d
x
1
d
t
=
x
1
+
x
2
d
x
2
d
t
=
4
x
1
−
2
x
2
(7)
\begin{cases} \frac{dx_1}{ dt} = x_1 + x_2\\\\ \frac{dx_2}{ dt} = 4x_1 - 2x_2 \tag{7} \end{cases}
⎩⎪⎨⎪⎧dtdx1=x1+x2dtdx2=4x1−2x2(7)
上面的微分方程组可以写成如下形式:
d
d
t
[
x
1
x
2
]
=
[
1
1
4
−
2
]
[
x
1
x
2
]
(8)
\frac{d}{dt}\begin{bmatrix} x1\\ x2\\ \end{bmatrix} = \begin{bmatrix} 1&1\\ 4& -2\\ \end{bmatrix} \begin{bmatrix} x1\\ x2\\ \end{bmatrix}\tag{8}
dtd[x1x2]=[141−2][x1x2](8)
上式可以写成状态空间的表达形式:
x
˙
=
A
x
(9)
\dot x=Ax \tag{9}
x˙=Ax(9)
令:
x
=
P
y
(10)
x=Py\tag{10}
x=Py(10)
那么:
x
˙
=
P
y
˙
(11)
\dot x=P \dot y\tag{11}
x˙=Py˙(11)
对(11)左右乘
A
A
A 得到:
A
x
=
A
P
y
(12)
Ax=APy \tag{12}
Ax=APy(12)
又因为对角矩阵
Λ
=
[
λ
1
0
0
λ
2
]
=
[
2
0
0
−
3
]
\Lambda= \begin{bmatrix} \lambda_1&0\\ 0 & \lambda_2\\ \end{bmatrix} = \begin{bmatrix} 2&0\\ 0 & -3\\ \end{bmatrix}
Λ=[λ100λ2]=[200−3]
P = [ v 1 v 2 ] = [ 1 1 1 − 4 ] P=\begin{bmatrix} v1\ v2\\ \end{bmatrix}= \begin{bmatrix} 1&1\\ 1 & -4\\ \end{bmatrix} P=[v1 v2]=[111−4]
根据式子(9)(11)(12)得到,
P
y
˙
=
A
P
y
(13)
P \dot y = APy \tag{13}
Py˙=APy(13)
上式乘以
P
−
1
P^{-1}
P−1得到:
y
˙
=
P
−
1
A
P
y
(14)
\dot y = P^{-1}APy \tag{14}
y˙=P−1APy(14)
又因为(5)式
P
−
1
A
P
=
Λ
\color{blue}P^{-1}AP= \Lambda
P−1AP=Λ,(14)就变为:
y
˙
=
Λ
y
(15)
\dot y = \Lambda y \tag{15}
y˙=Λy(15)
于是,有
y
˙
=
[
2
0
0
−
3
]
y
(16)
\dot y = \begin{bmatrix} 2&0\\ 0 & -3\\ \end{bmatrix} y \tag{16}
y˙=[200−3]y(16)
那么:
{
y
˙
1
=
2
∗
y
1
y
˙
2
=
−
3
∗
y
2
(17)
\begin{cases} \dot y_1 = 2*y_1 \\ \dot y_2 = -3*y_2 \\ \end{cases} \tag{17}
{y˙1=2∗y1y˙2=−3∗y2(17)
根据微分方程的解法:得到:
{
y
1
=
C
1
∗
e
2
t
y
2
=
C
2
∗
e
−
3
t
(18)
\begin{cases} y_1 = C_1*e^{2t} \\ y_2 = C_2*e^{-3t} \tag{18} \end{cases}
{y1=C1∗e2ty2=C2∗e−3t(18)
其中,
C
1
C_1
C1 、
C
2
C_2
C2为常数。
把上面结果带入(10) 式 x = P y \color{blue}x=Py x=Py, 那么:
x = P y = [ 1 1 1 − 4 ] [ C 1 ∗ e 2 t C 2 ∗ e − 3 t ] = [ C 1 ∗ e 2 t + C 2 ∗ e − 3 t C 1 ∗ e 2 t − 4 C 2 ∗ e − 3 t ] (19) x=Py =\begin{bmatrix} 1&1\\ 1 & -4\\ \end{bmatrix} \begin{bmatrix} C_1*e^{2t}\\ C_2*e^{-3t}\\ \end{bmatrix} \\\quad\\ =\begin{bmatrix} C_1*e^{2t}+C_2*e^{-3t} \\\quad\\ C_1*e^{2t}-4C_2*e^{-3t}\\ \end{bmatrix} \tag{19} x=Py=[111−4][C1∗e2tC2∗e−3t]=⎣⎡C1∗e2t+C2∗e−3tC1∗e2t−4C2∗e−3t⎦⎤(19)
这就是我们用特征值与特征向量的方法来解微分方程组。