[科学计算]非线性方程的数值求解

最新推荐文章于 2024-06-17 17:20:53 发布

OnePlus+

最新推荐文章于 2024-06-17 17:20:53 发布

阅读量1k

点赞数

分类专栏：科学计算非线性方程文章标签：算法线性代数

本文链接：https://blog.csdn.net/qq_39823607/article/details/106723817

版权

科学计算同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

非线性方程

1 篇文章 0 订阅

订阅专栏

实际问题中，线性方程甚至线性方程组都不是最常见的形式，世界的规律是错综复杂的，涉及更多的是非线性方程，而求解非线性方程的问题就显得颇为重要。那么这一节中，我们的出发点就是如何求解非线性方程 $f (x) = 0$ 的根.

1. 对分区间法

相必大家记得这么一个定理： $若f(x)\in C[a,b]，且f(a) ·f(b) < 0，则f(x)在(a,b)上必有一根。$ 这一句话便是“对分区间法”的依据。

操作步骤

如下图所示

选取当前区间的对分点 $x_1=\frac{a+b}{2}$ ；
判断 $f(x_1)$ 的正负，若 $f(x_1)<0$ 则 $a_1=x_1,b_2=b$ ;若 $f(x_1)>0$ 则 $a_1=a,b_2=x_1.$
重复步骤1、2，直到满足条件 $|x_{k}-x^{*}|<\varepsilon$ 或者 $|f(x_k)|<\varepsilon$ .

需要注意的是对于不同的情况，需要合理选择不同的停机条件。

在这里插入图片描述

误差分析

那么通过区间对分的方法求方程的根所带来的误差究竟有多大呢？在第1步中， $|x_1-x^*| \le \frac{b-a}{2}$ , 在第2步中， $|x_2-x^*|\le \frac{b-a}{2^2}$ , 以此类推，可知第 $k$ 步二分区间得到的 $x_n$ 的误差为 $|x_k-x^*| \le \frac{b-a}{2^k}$ .

因此，在给定误差范围 $\varepsilon$ 时，我们可以计算出需要二分区间的次数 $k$ .
$\begin{aligned} |x_k-x^*|\le \frac{b-a}{2^k} \le \varepsilon \\ k \ge \frac{\ln(b-a)-\ln \varepsilon}{\ln2} \end{aligned}$

该方法的不足之处

不能解决有重根的情况

2. 迭代法

$\begin{aligned} \text{等价变换：}f(x)=0 => x=g(x) \end{aligned}$

将 $f (x) = 0$ 求根问题转化为 $x = g (x)$ 的不动点问题。从一个初值 $x_0$ 出发，依次计算 $x_1=g(x_0),x_2=g(x_1),\cdots$ 得出一个序列 ${x_i\}$ ,如果这个序列是收敛于 $x^*$ , 即 $\displaystyle \lim_{k \rightarrow +\infty} x_k= \displaystyle \lim_{k \rightarrow + \infty} {x_{k+1}} = \displaystyle \lim_{k \rightarrow +\infty} g(x_k) = x^*$ ,如果此时的 $g (x)$ 是连续函数，根据连续的定义可得出 $g(x^*) = x^*$ ,也就是说 $x^*$ 是 $g (x)$ 的不动点，也就是 $f (x) = 0$ 的根。

那么如何保证由 $g (x)$ 构造出来的序列 ${x_i\}$ 是收敛的呢？这里有一个定理来保证这件事情。

全局收敛定理： $\in C[a,b].若: \\ (1) x \in [a,b]时,g(x)\in [a,b]. \\ (2)\exist L,0\le L<1,使得|g'(x)| \le L < 1.\forall x \in [a,b]成立. \\则任取x_0 \in [a,b],由x_{k+1}=g(x_k)产生的序列\{x_i\}一定收敛于g(x)在[a,b]上唯一的不动点,并且有误差估计式\\ |x^*-x_k|\le \frac{1}{1-L}|x_{k+1}-x_k| \\ |x^* - x_k| \le \frac{L^k}{1-L}|x_1-x_0|$

上面的定理给出的初值 $x_0$ 的范围相对较大，我们还可以利用局部收敛性进行简化定理： $设x^*为g(x)的不动点,并且g'(x)在x^*的某个邻域R内连续,还有|g'(x^*)|<1, 则任意x_0\in R，迭代产生的序列\{x_i\}\in R\\收敛到x^*.$

迭代法的收敛阶

对于迭代过程的收敛快慢，我们可以用收敛阶来度量。什么是收敛阶呢？我们这么定义：设迭代公式 $x_{k+1}=g(x_k)$ 构造的序列 ${x_i\}$ 收敛到 $g (x)$ 的不动点 $x^*$ ，令 $e_k = x_k - x^*$ ，若 $\displaystyle\lim_ {k \rightarrow +\infty} \frac{|e_{k+1}|}{|e_k|^p} = C >0$ ，则称该迭代格式为 $p$ 阶收敛， $C$ 为渐进误差常数。

一方面，我们可以根据定义来确定收敛阶、渐进误差常数。但实际上是很难操作的，那么在平常我们该如何确定收敛阶和渐进误差常数呢？我们有下面这个定理：

$设x^*为g(x)的不动点,若g(x) \in C^p[B_{\delta}(x^*)],p\ge 2,g'(x^*)=\cdots=g^{p-1}(x^*)=0,且g^p(x^*)\neq 0.\\则x_{k+1}=g(x_k)在B_{\delta}(x^*)内p阶收敛.$
$\begin{aligned} 证明：令g(x_k)在x^*处作Taylor展开 \\ g(x_k) &= g(x^*) + g'(x^*)(x_k-x^*)+\frac{g^{(2)}(x^*)}{2!}(x_k-x^*)^2+\cdots+\frac{g^{(p-1)}(x^*)}{(p-1)!}(x_k-x^*)^{p-1}+\frac{g^{(p)}(x^*)}{p!}(x_k-x^*)^p \\ x_{k+1} &= x^* + \frac{g^{(p)}(x^*)}{p!}(x_k-x^*)^p \\ \frac{|x_{k+1}-x^*|}{|x_k-x^*|^p} &= \frac{g^{(p)}(x^*)}{p!}=C \end{aligned}$

几种常见的迭代法

可以看出，迭代法的关键在于选取合适的迭代函数g(x)。对于 $f (x) = 0$ ，最简单的一种构造方法便是 $x = x + f (x)$ ，迭代格式为 $x_{k+1}=x_k+f(x_k)$ 。但是一般情况下，这种格式不会收敛或者收敛的很慢。

为此，我们可以对它进行迭代-加速的改进处理。令 $\hat{x}_{k+1}=x_k +f(x_k)$
$\begin{aligned} x_{k+1} &= \frac{1}{1-q}\hat{x}_{k+1}-\frac{q}{1-q}x_k \\ x_{k+1} &= \frac{1}{1-q}[x_k +f(x_k)]-\frac{q}{1-q}x_k \\ x_{k+1} &= x_k +\frac{1}{1-q}f(x_k) \end{aligned}$
更一般的形式为 $x_{k+1} = x_k +\frac{1}{M}f(x_k)$ .

牛顿迭代法

简单来说，该方法就是利用Taylor公式将 $f (x)$ 在 $x^*$ 附近的某一点 $x_0$ 处进行一阶展开表示整理而来的。

$f(x)=f(x_0)+f'(x_0)(x-x^*)+\frac{f''(\xi)}{2!}(x-x^*)^2,\xi在x_0与x之间$

忽略余项，将 $x^*$ 代入上式得 $f(x^*) = f(x_0)+f'(x_0)(x^*-x_0)=0$ ，整理可得 $x^* =x_0 - \frac{f(x_0)}{f'(x_0)}$ ，从而牛顿迭代公式可以这样定义
$\begin{aligned} x_{k+1} = x_k - \frac{f(x_k)}{f'(x_k)} \end{aligned}$
我们可以从几何意义上去理解牛顿迭代法，如图

在这里插入图片描述

假设此时并不知道 $x^*$ ，我们有一个初始值 $x_0$ ,根据 $f (x)$ 我们可以求出 $f(x_0),f'(x_0)$ ，图中蓝线的斜率为 $f'(x_0) = \frac{f(x_0)}{x_0-x_1}$ ，从而可以确定 $x_1$ 的位置，可以这样迭代下去，直到 $|f(x_k)|< \varepsilon$ .

这时，我们要问了：由牛顿迭代构造的序列 ${x_i\}$ 一定收敛吗？初值是不是好选择？它收敛的值是 $g (x)$ 的不动点吗？

首先，在序列 ${x_i\}$ 收敛的条件下，最后一个问题可以解决，只要 $g (x)$ 满足连续就可以了。由于 $g(x)=x-\frac{f(x)}{f'(x)}$ ，所以只需要 $f(x)\in C^1[a,b],且f'(x)\neq 0$ 。

第一个问题该怎么解决呢？这就回到了全局收敛定理，它是从不动点的角度出发讨论条件，这个条件有点难，我们换一种从根的角度讨论的思路：

$收敛的充分条件：设f(x)\in C^2[a,b].若满足：\\(1)f(a)f(b)<0\\(2) 在[a,b]上f''(x)不变号且f'(x) \neq 0 \\ (3) 选取x_0 \in [a,b],需要满足f(x_0)f''(x_0)>0\\ 则由牛顿迭代法构造的序列\{x_i\}收敛于f(x)在[a,b]上的唯一根$

上面定理中前两个条件还好说，是一个硬要求，但是第三个条件对我们提出的第二个问题就不友好了。因此利用迭代法局部收敛的定理，做下面的改进： $局部收敛定理：设f(x)\in C^2[a,b],若x^*为f(x)在[a,b]上的根，且f'(x^*)\neq 0.则存在B_{\delta}(x^*),使得\forall x_0 \in B_{\delta}(x^*),\\由牛顿迭代法产生的序列\{x_i\}收敛到x^*,且满足\displaystyle \lim_{k \rightarrow +\infty} \frac{x^*-x_{k+1}}{(x^*-x_k)^2}=-\frac{f''(x^*)}{2f'(x^*)}$

在这里 $x_0$ 的选择是任意的，但是是在邻域内，这个邻域的寻找还是有点问题的。因此牛顿迭代法的收敛性速度还是依赖于 $x_0$ 的选择。

在这里插入图片描述

简化牛顿迭代法

这个的改进是针对 $f‘(x_k)$ 比较难计算而提出的。将 $f'(x_k)$ 都替换为 $f'(x_0)$ ，不用每次迭代都计算导数，节省大量计算难度
$\begin{aligned} x_{k+1} = x_k - \frac{f(x_k)}{f'(x_0)} \end{aligned}$
更一般的形式是不计算导数，而直接用一个常数代替
$\begin{aligned} x_{k+1} = x_k - Cf(x_k) \end{aligned}$

牛顿下山法

在前面提到的方法中，并不能保证每次的迭代 $f(x_{k+1})|< |f(x_k)|$ ，为了更好地确保迭代的收敛，我们添加一条件，使之具有单调性，即若 $|f(x_{k+1})|\ge |f(x_k)|$ ,需要在 $x_{k+1}$ 和 $x_k$ 之间重新选择 $\hat{x}_{k+1}$ 点。

在这里插入图片描述
$\begin{aligned} \hat{x}_{k+1} &= \lambda x_{k+1}+(1- \lambda)x_k \\ \hat{x}_{k+1} &= \lambda (x_{k} - \frac{f(x_k)}{f'(x_k)})+(1- \lambda)x_k \\ \hat{x}_{k+1} &= x_k - \lambda \frac{f(x_k)}{f'(x_k)} \end{aligned}$
默认情况下 $\lambda = 1$ ，如果在迭代中由 $x_k$ 得到的 $x_{k+1}$ 不能使 $∣ f ∣$ 减小，则将 $\lambda$ 减半计算直到满足条件。

正割法、抛物线法

正割法是将迭代格式中的 $f'(x_k)$ 使用差商来近似，避免求导的过程。此时 $f'(x_k) \approx \frac{f(x_{k})-f(x_{k-1})}{x_k -x_{k-1}}$ .
$\begin{aligned} x_{k+1} &= x_k - \frac{f(x_k)}{f'(x_k)} \\ x_{k+1} &\approx x_k - \frac{f(x_k)(x_k - x_{k-1})}{f(x_k)-f(x_{k-1})} \end{aligned}$
这个时候则需要两个初始值。