数值分析(4)：非线性方程和方程组的数值解法

最新推荐文章于 2024-07-29 00:58:39 发布

ReEchooo

最新推荐文章于 2024-07-29 00:58:39 发布

阅读量4.5k

点赞数 6

分类专栏：数值分析

本文链接：https://blog.csdn.net/qq_41773233/article/details/115432438

版权

数值分析专栏收录该内容

13 篇文章 27 订阅

订阅专栏

非线性方程和方程组的数值解法

1. 引言
2. 二分法和割线法
- 2.1 二分法
- 2.2 割线法
3. 不动点迭代法
4. Newton迭代法
- 4.1 Newton迭代法思路
- 4.2 收敛性与收敛阶
5. 迭代加速收敛的方法
- 5.1 Aitken加速方法
- 5.2 steffensen迭代方法
6. 非线性方程组的数值解法

1. 引言

对于n次多项式方程，必定有n个复数根（代数基本定理）。

判断一个根是几重根，可以用导数来判断，如果 $f^{(m-1)}(x^*) = 0$ 但是 $f^{(m)}(x^*) \neq 0$ ，那么 $x^*$ 是 $f (x) = 0$ 的m重根。

2. 二分法和割线法

2.1 二分法

基本原理就是《高等数学》中的 零点定理：只要连续函数在一个闭区间上端点的函数值异号，那么在这个闭区间内至少存在一个零点。

对这个区间进行二分，每次迭代都使区间长度缩小一半，始终保持两个端点函数值异号，当然这样能够求出一个解，所以为了保证在二分的过程中不漏解，需要保证区间内只存在唯一解。保证方法就是保证函数在区间内单调。

假设初始时区间为 $[a, b]$ ，那么在第n次（初始算第一次）迭代后区间长度为：

$b_n-a_n=\frac{1}{2^{n-1}} (b-a)$

令区间 $a_n,b_n]$ 的中点为 $x_n$ ，而方程的精确解为 $x^*$ ，那么 绝对误差界 $\epsilon$ 为：
$|x_n-x^*| \leq \frac{1}{2^{n}} (b-a) = \epsilon$

2.2 割线法

割线法的图像理解即为下图，即取区间端点构成的直线与x轴的交点作为新的区间长度。
在这里插入图片描述
割线法的公式可以由Newton迭代法推导出来。

上图中红线框的即为割线法迭代公式。

3. 不动点迭代法

3.1 不动点和不动点迭代法

设 $f (x)$ 是一元连续函数，要解的方程是：
$f (x) = 0$

为进行迭代，上式变成等价形式
$x=\varphi(x)$
其中 $\varphi(x)$ 是连续函数。当然，这种等价形式有无穷多个。

构造迭代公式：
$x_{k+1}=\varphi(x_k)$

如果 $\underset{k\rightarrow \infty}{\lim}x_k=x^*$ ，则： $x^*=\varphi(x^*)$ 。称 $\varphi$ 为 迭代函数， $x^*$ 为函数 $\varphi$ 的一个 不动点。上述方法也称为 不动点迭代法。

显然并不是任何迭代函数都能式 $x_{k+1}=\varphi(x_k)$ 收敛。

当 $\varphi(x)$ 满足以下两个条件时，迭代法必定收敛：
在这里插入图片描述
映内性 保证必定存在不动点。
压缩性 保证不动点在此区间内唯一，并且不动点迭代法必定收敛。

注意映内性和压缩性都是对区间 $[a, b]$ 上的任意一点成立。

对定理2.1的五个备注：
在这里插入图片描述

注意在第二备注中，Lipschitz 条件 并不容易判断，因为它要对区间 $[a, b]$ 上任意两点成立。没有导数判别法方便。

一些常见的不动点迭代的图像如下所示：
在这里插入图片描述

3.2 全局收敛性

满足上述定理2.1，就说明了在区间 $[a, b]$ 上的 全局收敛性。且有如下误差估计公式：
在这里插入图片描述

3.3 局部收敛性

通常全局收敛性因为对整个区间 $[a, b]$ 有要求，所以不易检验，为了缩小区间长度，引出了 局部收敛性 的定义和定理。

定义：
在这里插入图片描述
定理：

注意定义强调的是一个 $\delta$ 的小区间，而定理强调的是一个点 $x^*$ 。

关于局部收敛定理，有两点需要注意：

这个定理仍然说明了 映内性 和 压缩性 ，“ $x^*$ 为 $\varphi$ 的不动点”就代替了映内性，并且比映内性还强，因为它说明了唯一性。可以证明 $|\varphi'(x^*)| < 1$ 与压缩性等价。
在使用这个定理进行判别时需要注意，我们并不知道真解 $x^*$ 的值，因为要求解的就是 $x^*$ ，所以 $|\varphi'(x^*)| < 1$ 这个也判定不了。

局部收敛性的好处是，这个 $x^*$ 的邻域可以自己定，只要在这个邻域内的导数绝对值小于1，那么它就是局部收敛的。

为了说明 局部收敛的速度 ，有如下 收敛阶 （收敛速度）的定义：

在这里插入图片描述

通过定义可以推导如下定理：

在这里插入图片描述

上述定理有两点需要注意：

真解 $x^*$ 仍然是不知道的
上述定理只能判断2阶收敛及2阶收敛以上的局部收敛，无法判断1阶收敛。

总结：
判断收敛阶的步骤：

假设我们知道了真解 $x^*$ ，计算得到：

（1） $|\varphi'(x^*)| > 1$ ，那么不动点迭代法必定发散

（2） $|\varphi'(x^*)| = 1$ ，那么不动点迭代法可能收敛可能发散

（3） $0<|\varphi'(x^*)| < 1$ ，那么不动点迭代法收敛，且为1阶收敛。

（4） $|\varphi'(x^*)|=0$ ，那么继续计算导数，直到求导某一阶导数 $|\varphi^{(m)}(x^*)|\neq0$ ，那么不动点迭代法收敛，且为m阶收敛。

4. Newton迭代法

4.1 Newton迭代法思路

Newton迭代法的思路：
在这里插入图片描述
显然 $x^*$ 是公式（3.1）的解，即为 $\varphi(x)=x-f(x)/f'(x)$ 的不动点。Newton迭代法就是不动点迭代。

Newton迭代法的图像解释：
在这里插入图片描述

可以看到就是不断做曲线的切线，来逼近曲线与x轴的交点。

4.2 收敛性与收敛阶

对于Newton迭代法的收敛性与收敛阶，有如下定理：
在这里插入图片描述
注意定理中要求 $x^*$ 为单重根，即 $f'(x^*)\neq0$ 。一旦 $f'(x^*)=0$ ，那么就说明 $x^*$ 为多重根，Newton迭代法仍然能够收敛，且为线性收敛（即一阶收敛）。

为了让Newton迭代法对重根仍然是平方收敛，有以下两种处理方式：
处理方式一：
在这里插入图片描述
但这个处理方式一需要知道 $x^*$ 是 $f (x)$ 的m重根，实际上 $x^*$ 就是我们要求解的，因此根本不可能知道m。因此处理方式一一般用不了。

处理方式二：
在这里插入图片描述

5. 迭代加速收敛的方法

5.1 Aitken加速方法

如果一个序列 ${x_k\}$ 线性收敛，那么可以通过Aitken加速方法，构造一个新的序列 $\{\bar{x}_k\}$ 使得它更加快地收敛。

构造方法如下：
在这里插入图片描述

值得注意的是，这个构造方法的前提是序列 ${x_k\}$ 线性收敛，如果序列 ${x_k\}$ 发散，那么加速方法不成立。并且这个加速方法只是说比序列 ${x_k\}$ 收敛更快，但是不知道快多少，即有以下定理：

在这里插入图片描述

5.2 steffensen迭代方法

steffensen迭代方法可以看做是从Aitken加速方法演化而来的，根据不动点的迭代公式
$x_{k+1} = \varphi(x_k)$
可以把 $x_{k+2}$ 看做 $\varphi(\varphi(x_k))$ ，可以把 $x_{k+1}$ 看做 $\varphi(x_k)$ ，因此根据上式（4.1），可以构造迭代函数 $\psi(x)$ 为：
在这里插入图片描述

关于steffensen迭代方法有如下定理：
在这里插入图片描述
注意，定理没要求 $\varphi(x)$ 收敛，只要 $x^*$ 为 $\varphi(x)$ 的不动点即可，因此如果 $\varphi(x)$ 不收敛，最后构造出来的 $\psi(x)$ 能让它收敛到 $x^*$ 。

6. 非线性方程组的数值解法

对于一个一元方程 $f (x) = 0$ ，我们可知其Newton迭代法为：

在这里插入图片描述

进一步改写一下，即为：
在这里插入图片描述

那么，对于二元方程组：
在这里插入图片描述

Newton迭代法的公式为：
在这里插入图片描述

其中：

在这里插入图片描述

那么对于n个n元非线性方程组，解法也与上面类似，求出雅可比矩阵后还需要对雅可比矩阵求逆。

参考文献：
关治，陆金甫《数值方法》

ReEchooo

关注

6
点赞
踩
40

收藏

觉得还不错? 一键收藏
0
评论
数值分析(4)：非线性方程和方程组的数值解法

非线性方程和方程组的数值解法1. 引言2. 二分法3. 不动点迭代法3.1 不动点和不动点迭代法3.2 全局收敛性3.3 局部收敛性4. Newton迭代法4.1 Newton迭代法思路4.2 收敛性与收敛阶1. 引言对于n次多项式方程，必定有n个复数根（代数基本定理）。判断一个根是几重根，可以用导数来判断，如果f(m−1)(x∗)=0f^{(m-1)}(x^*) = 0f(m−1)(x∗)=0但是f(m)(x∗)≠0f^{(m)}(x^*) \neq 0f(m)(x∗)=0，那么x∗x^*x∗是
复制链接

扫一扫

专栏目录