23微分方程和exp(At)

我什么都布吉岛

已于 2022-10-08 20:54:08 修改

阅读量1.4k

点赞数

分类专栏： # 线性代数文章标签：矩阵

于 2022-09-23 10:53:11 首次发布

本文链接：https://blog.csdn.net/weixin_39258979/article/details/127006542

版权

线性代数专栏收录该内容

41 篇文章

订阅专栏

预备知识

1.1 一阶线性齐次微分方程的解

$\frac{dy}{dx}+P(x)y=0\tag{1}$
其齐次通解为：
$y=Ce^{-\int P(x)dx}\tag{2}$
令 $P(x)=-\lambda$ ， $\lambda$ 为常数。(1)对应的方程为：
$\frac{dy}{dx}=\lambda y\tag{3}$
对应的解为：
$y=Ce^{\lambda x}\tag{4}$
特别的， $\lambda=0$ ，有： $y = C$ ，结论(3)(4)是求解微分方程的基础。

1.2 欧拉公式

$e^{i\theta}=\cos\theta+i\sin\theta\tag{5}$
对于任意一个角度，欧拉公式给出了单位圆上唯一的复数，请注意不是一一对应，因为对于任意 $\theta+2k\pi$ 都表示同一个复数。需要留意的是 $e^{a+bi}$ 的模为：
$e^{a+bi}=e^a e^{bi}=\vert e^a\vert\vert e^{bi}\vert$
复数部分，套用欧拉公式有：
$\vert e^{bi}\vert=\vert \cos b+i \sin b\vert=\cos^2b+\sin^2b=1$
结论就是：e的复数指数的模长等于实数部分的数值。

一、常系数微分方程组

不考虑耦合情况，求解以下微分方程是容易的：
$\frac{du}{dt}=u \quad \frac{du}{dt}=\lambda u\tag{6}$
微分方程的解分别是：
$u(t)=Ce^t\quad u(t)=Ce^{\lambda t}\tag{7}$
假如，两个微分方程组相互耦合，那么应该如何求解其微分方程组的解？看一个具体的例子：

$\begin{aligned} \frac{du_1}{dt}&=-u_1+2u_2\\ \frac{du_2}{dt}&=u_1-2u_2 \end{aligned}\tag{8}$
如何求解？两个方程相加有：
$\frac{d(u_1+u_2)}{dt}=0(u_1+u_2)\tag{9}$
上式减去两倍的下式，有：
$\frac{d(u_1-2u_2)}{dt}=-3(u_1-2u_2)\tag{10}$
将 $u_1+u_2$ 看成一个整体，方程(9)对应的微分方程的解为
$u_1+u_2=C_1e^{0t}\tag{11}$
同样，将 $u_1-2u_2$ 看成一个整体有：
$u_1-2u_2=C_2e^{-3t}\tag{12}$
进行一些简单的消元操作，可以得到微分方程组的解：
$\begin{aligned} u_1=\frac{2C_1}{3}e^{0t}+\frac{C_2}{3}e^{-3t}\\ u_2=\frac{C_1}{3}e^{0t}-\frac{C_2}{3}e^{-3t} \end{aligned}\tag{13}$
至此，微分方程组求解完毕。从求解过程可以看出：

求解一阶常系数微分方程组的基本方法就是通过线性变换右侧，使得左侧微分对象恰好等于组合的结果；
微分方程组的解是多个 $e^\lambda t$ 组成的，也就是 $u_i=\sum C_ie^{\lambda_it}x_i$ ；[1]

这个和矩阵有何关系？或许写成矩阵更加容易看出一些端倪：
$\frac{d}{dt}\begin{bmatrix} {u_1}\\ {u_2} \end{bmatrix}=\begin{bmatrix}-1&2\\1&-2\end{bmatrix}\begin{bmatrix}u_1\\u_2\end{bmatrix}\tag{14}$
我们微分方程组的解 $u_1$ 和 $u_2$ 看成未知数列向量： $x=\begin{bmatrix}u_1\\u_2\end{bmatrix}$ ，右侧的系数组合看成是系数矩阵 $A=\begin{bmatrix}-1&2\\1&-2\end{bmatrix}$ 。一个矩阵作用于一个向量大概率会改变这个向量的方向，我们的目标是通过线性变换，这和将方程式左边的向量变成是与之同方向的向量是一样的，一旦能写成同方向的向量，这个方程就是一个容易求解的一阶线性微分方程。

啰里啰唆，其实就是想说明：我们可以利用特征值和特征向量的概念来求解微分方程组。下面来看看这个微分方程组是如何通过特征值和特征向量求解的。令
$A=\begin{bmatrix} -1&2\\ 1&-2 \end{bmatrix}\tag{15}$
容易求得其特征值： $\lambda_1=0$ $\lambda_2=-3$ ，对应的特征向量为: $x_1=\begin{bmatrix}2\\1\end{bmatrix}$ 和 $x_2=\begin{bmatrix}1\\-1\end{bmatrix}$ ，根据通解公式有：
$u(t)=C_1e^{0t}\begin{bmatrix}2\\1\end{bmatrix}+C_2e^{-3t}\begin{bmatrix}1\\-1\end{bmatrix}$
如果给定初值： $u_0=\begin{bmatrix}1\\0\end{bmatrix}$ ，可以确定 $C_1$ 和 $C_2$ 的具体数值。最终的解为：
$u(t)=\frac{1}{3}e^{0t}\begin{bmatrix}2\\1\end{bmatrix}+\frac{1}{3}e^{-3t}\begin{bmatrix}1\\-1\end{bmatrix}$

也就是：
$u_1(t)=\frac{2}{3}e^{0t}+\frac{1}{3}e^{-3t}\\ u_2(t)=\frac{1}{3}e^{0t}-\frac{1}{3}e^{-3t}$
微分方程的两个解的趋势如何？

如果特征值为0，那么该分量是一个定值与时间无关；
如果特征值为负实数，随着时间的推移，该分量将会趋近于0；
如果特征值为正实数，随着时间的推移，该分量将会变得无穷大；
如果特征值为负数，只需要看实数部分正负即可，同23点，复数部分只是在指明方向，一直在单位圆上转圈圈；

最后讲一下解的稳定性问题：

稳定性（stability）。如果定义 $u(t)\rightarrow 0$ 为稳定状态，那么特征值应该满足什么条件？答：实数部分都小于零；(模是收敛的)
稳态（steady state）。存在一个特征值为0，其他特征值实部小于0；
震荡（blow up）。如果存在任意特征值实属部分大于零。

对于一个 $2\times2$ 矩阵 $A=\begin{bmatrix}a&b\\c&d\end{bmatrix}$ 的稳定性条件是什么？
答：根据之前的讨论，矩阵需要满足稳定的条件是： $\lambda_1<0$ $\lambda_2<0$ 。如果不计算特征值，我们是否可判断这个矩阵的稳定性？

迹（trace）小于零。 $a+d=\lambda_1+\lambda_2<0$
行列式（determinant）的值大于0 $\lambda_1\lambda_2>0$

二、e的矩阵次方

回到原来的方程：
$\frac{du}{dt}=Au$
我们的目的是将方程组 $u$ 解耦，不妨设 $u = S v$ ，其中 $S$ 为矩阵 $A$ 特征向量构成的特征矩阵。（将 $u$ $v$ 想象向量，因为 $S$ 是特征向量矩阵，故一定是线性无关，所以一定存在 $v$ 使得 $u = S v$ 成立）。将条件 $u = S v$ 带入方程有：
$S\frac{dv}{dt}=ASv$
将 $S$ 移到右边有：
$\frac{dv}{dt}=S^{-1}ASv=\Lambda v$
为什么我们要大费周折的将一个方程式化简成对角矩阵？答案就是解耦，一旦系数矩阵变成了对角矩阵，微分方程之间的耦合将不再存在！不存在耦合求解微分方程简直不要太常规：
$v_1=c_1e^{\lambda_1 t}\\ v_2=c_2e^{\lambda_2 t}\\ \cdots$
将其写成矩阵形式：
$\begin{bmatrix}v_1\\v_2\\\vdots\\v_n\end{bmatrix}=\begin{bmatrix} e^{\lambda_1 t}&\cdots&\cdots&0\\ 0&e^{\lambda_2t}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&0&e^{\lambda_nt} \end{bmatrix}\begin{bmatrix}c_1\\c_2\\\vdots\\c_n\end{bmatrix}$
也就是： $v(t)=e^{\Lambda }C$ ，当 $t = 0$ 时，系数矩阵变成单位矩阵，此时 $V (0) = C$ 。
$v(t)=e^{\Lambda t }v(0)$
将 $u (t) = S v (t)$ 代入上式有：
$u(t)=Se^{\Lambda t}S^{-1}u(0)$
事实上：
$e^{A t}=Se^{\Lambda t}S^{-1}$
所以，最后的解为：
$u(t)=e^{At}u(0)$

矩阵指数定义如下：
$e^{At}=I+At+\frac{(At)^2}{2}+\frac{(At)^3}{6}+\cdots+\frac{(At)^n}{n!}$
上述的展开是收敛的，因为随着 $n$ 的增大，通项收敛于0；

这与高等数学里的 $e^x$ 对应： $e^x=\sum_{n=0}^{\infty}\frac{x^n}{n!}$
利用高数极限的定义可证，当 $n\rightarrow+\infty$ 时， $e^x\rightarrow0$ 。
(几何级数)：
$\frac{1}{1-x}=\sum_{n=0}^{\infty}X^n$

类比几何级数有：
$(I-At)^{-1}=I+At+At^2+\cdots$
这个性质可用来估计矩阵的逆，当 $t$ 比较小的时候，高阶项可以忽略。这个式子不一定收敛，收敛条件是 $A t$ 的特征值小于1，求逆公式成立。

利用 $e^{At}$ 的定义，我们来推导当满足 $A$ 可对角化情况下的表达式：
$\begin{aligned} e^{A t}&=I+At+\frac{(At)^2}{2}+\frac{(At)^3}{6}+\cdots+\frac{(At)^n}{n!}\\ &=S\Lambda^0S^{-1}+S\Lambda^1S^{-1}t+\frac{1}{2!}S\Lambda^2S^{-1}t^2+\cdots+\frac{1}{n!}S\Lambda^nS^{-1}t^n\\ &=S(I+\Lambda t+\frac{1}{2!}\Lambda^2 t^2+\frac{1}{3!}\Lambda^3 t^3+\cdots+\frac{1}{n!}\Lambda^n t^n)S^{-1}\\ &=Se^{\Lambda t}S^{-1} \end{aligned}$
特征值构成的矩阵 $\Lambda$ ：
$\Lambda=\begin{bmatrix} \lambda_1&0&\cdots&0\\ 0&\lambda_2&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\lambda_n \end{bmatrix}$
回到一开始的 $v(t)=e^{\Lambda t}v(0)$ ，因为已经解耦，所以每一列都代表了对应解的形式，故：
$e^{\Lambda t}=\begin{bmatrix} e^{\lambda_1 t}&0&\cdots&0\\ 0&e^{\lambda_2 t}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&e^{\lambda_n t} \end{bmatrix}$
对于，考察 $u (t)$ ，因为 $C=S^{-1}u(0)$ ，所以：
$\begin{aligned} u(t)&=e^{At}u(0)\\ &=\begin{bmatrix}x_1&x_2&\cdots&x_n\end{bmatrix} \begin{bmatrix} e^{\lambda_1 t}&0&\cdots&0\\ 0&e^{\lambda_2 t}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&e^{\lambda_n t} \end{bmatrix}\begin{bmatrix}c_1\\c_2\\\vdots\\c_n\end{bmatrix}\\ &=c_1x_1e^{\lambda_1t}+c_2x_2e^{\lambda_2t}+\cdots+c_nx_ne^{\lambda_n t} \end{aligned}$
这个与我们认识的通解形式是一致的。

怎么样的特征值会使得微分方程有稳定解？
答：根据稳定性的定义，当微分方程的表达式趋于0时，微分方程具有稳定解。
$u(t)=Se^{\Lambda t}S^{-1}u(0)$
表达式 $S$ 和 $S^{-1}$ 不变，趋势和 $e^{\Lambda t}$ 有关：
$e^{\Lambda t}=\begin{bmatrix} e^{\lambda_1 t}&0&\cdots&0\\ 0&e^{\lambda_2 t}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&e^{\lambda_n t} \end{bmatrix}$
当且仅当，所有特征根都小于零时，微分方程的结果随着时间的增大会趋于一个稳定的值：0。在复平面上标记特征根，他应该出现在复平面的左半部分：
在这里插入图片描述

三、高阶常系数微分方程

对于一个二阶微分方程：
$y^{''} + b y^{'} + k y = 0$
一个常用的技巧就是降阶：
$u=\begin{bmatrix}y'\\y\end{bmatrix}$
于是，二阶方程可以写成：
$u'=\begin{bmatrix}y''\\y'\end{bmatrix}=\begin{bmatrix}-b&-k\\1&0\end{bmatrix}\begin{bmatrix}y'\\y\end{bmatrix}$
也就是
$u^{'} = A u$
解法和前面讲到的一样，不过 $u$ 内容变成了解的各阶导数。