数值方法笔记2：解决非线性方程_非线性方程 muller-CSDN博客

本文链接：https://blog.csdn.net/subtitle_/article/details/129105089

文章详细介绍了不动点定理及其条件验证，包括收敛阶的估计和加速方法。此外，讨论了如何预测不动点迭代所需的迭代次数，并分析了不动点迭代的优缺点。接着，文章探讨了求解非线性方程组的应用，如二分法、试位法、牛顿-拉夫逊方法、割线法以及Aitken过程加速等。最后，提到了初值选择、收敛条件和算法选择的考虑因素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 不动点定理及其条件验证
2. 收敛阶、收敛检测与收敛加速
3. 应用：如何求解非线性方程组 $f (x) = 0$ 的解
4. 其他问题

1. 不动点定理及其条件验证

不动点定义： ${P}={g}({P})$
不定点迭代： ${x}_{{k}+1}={g}\left({x}_{{k}}\right)$
定理：如果 $g({x_k})$ 是连续的并且序列 ${x_k}$ 是收敛的， ${x_k}$ 收敛到方程的解： ${x}=g({x})$
${x}^{*}={g}\left({x}^{*}\right) \text { and } {x}_{{k}}->{x}^{*}$

在这里插入图片描述

定理：假设
(1) 对于 $g (x)$ ， $g'(x)\in C[a,b]$ （连续）
(2) $K$ 是一个正的常数
(3) $p_0\in(a,b)$
(4) $g(x)\in[a,b],\forall x\in[a,b]$
那么
(a) 如果 $\left|\mathrm{g}^{\prime}(x)\right| \leq \mathrm{K}<1 ， \forall x \in[\mathrm{a}, \mathrm{b}], \mathrm{x}_{\mathrm{k}+1}=\mathrm{g}\left(\mathrm{x}_{\mathrm{k}}\right)$ 收敛。
(b) 如果 $\left|\mathrm{g}^{\prime}(x)\right|>1 ， \forall x \in[\mathrm{a}, \mathrm{b}], \mathrm{x}_{\mathrm{k}+1}=\mathrm{g}\left(\mathrm{x}_{\mathrm{k}}\right)$ 不收敛

曲线的切线斜率 $k\in(-1,1)$ 看下面的图逐渐收敛：

在这里插入图片描述

在这里插入图片描述
曲线的切线斜率 $k\in[-\infty,-1)\cup (1,\infty]$ 看下面的图不收敛：

在这里插入图片描述

综上所述，不动点迭代满足最重要的是：

$\begin{aligned}&(1) \left|\mathrm{g}^{\prime}(x)\right| \leq \mathrm{K}<1 ,\forall x \in[\mathrm{a}, \mathrm{b}] & 【g'(x)的边界条件】\\ &(2) \mathrm{g}(x) \in[\mathrm{a}, \mathrm{b}] ， \forall x \in[\mathrm{a}, \mathrm{b}] ，并且有g([a, b]) \subset[a, b]& 【g(x)的边界条件】\end{aligned}$

单调和非单调要分别判断边界条件，单调的g(x)的范围看端点就可以了，非单调还要看极值点。
在这里插入图片描述

2. 收敛阶、收敛检测与收敛加速

定义;
$\left|x_{k+1}-x^{*}\right| \leq C\left|x_{k}-x^{*}\right|^{p}, k>M \text {, for } C>0, p>0$
或
$\lim _{k \rightarrow \infty} \frac{\left|x_{k+1}-x^{*}\right|}{\left|x_{k}-x^{*}\right|^{p}}=C$
为 $p$ 阶收敛
其中：
$p = 1$ , 线性收敛（linear convergence）
$1 < p < 2$ , 超线性收敛（superlinear convergence）
$p = 2$ , 平方收敛（square convergence）

2.1 如何估计不动点迭代的收敛阶 ${x}_{{k}+1}={g}\left({x}_{{k}}\right)$

定理;设 $x^*$ 是最优解，如果 $g^{\prime}\left(x^{*}\right)=g^{\prime \prime}\left(x^{*}\right)=\ldots=g^{(p-1)}\left(x^{*}\right)=0$ , $g^{(p)}\left(x^{*}\right) \neq 0$ ， $x_{k+1}=g\left(x_{k}\right)$ 是 $p$ 阶收敛。

证明：
$\begin{aligned} x_{k+1}&=g\left(x_{k}\right)=g\left(x^{*}\right)+g^{\prime}\left(x^{*}\right)\left(x_{k}-x^{*}\right)+\ldots\\&+\frac{g^{(p-1)}\left(x^{*}\right)\left(x_{k}-x^{*}\right)^{p-1}}{(p-1) !} +\frac{g^{(p)}(\xi)\left(x_{k}-x^{*}\right)^{p}}{p !}, \quad【\xi \in\left[x_{k}, x^{*}\right] 或\left[x^{*}, x_{k}\right] 】\\ \Rightarrow& x_{k+1}=x^{*}+\frac{g^{(p)}(\xi)\left(x_{k}-x^{*}\right)^{p}}{p !} \\ \Rightarrow& \frac{x_{k+1}-x^{*}}{\left(x_{k}-x^{*}\right)^{p}}=\frac{g^{(p)}(\xi)}{p !} \rightarrow \frac{g^{(p)}\left(x^{*}\right)}{p !} \end{aligned}$

2.2 给定精度的情况下，如何预测不动点迭代需要迭代的次数

定义 $L=\max _{x \in[a, b]}\left\{\left|g^{\prime}(x)\right|\right\}<1$
迭代的次数满足： $\geq \ln \left(\varepsilon(1-L) /\left|x_{1}-x_{0}\right|\right) / \ln L$

证明：
$\begin{aligned}x_{k+1}=g\left(x_{k}\right)=g\left(x^{*}\right)+g^{\prime}(\xi)\left(x_{k}-x^{*}\right)=x^{*}+g^{\prime}(\xi)\left(x_{k}-x^{*}\right)\\ \Rightarrow \left|x_{k+1}-x^{*}\right| \leq\left|g^{\prime}(\xi) \|\left(x_{k}-x^{*}\right)\right| \leq L\left|x_{k}-x^{*}\right|\le L^{k}\left|x_{1}-x^{*}\right|\end{aligned}$
又有
$\left|x_{k+1}-x_{k}\right|=\left|g\left(x_{k}\right)-g\left(x_{k-1}\right)\right| \leq L\left|x_{k}-x_{k-1}\right| \leq L^{k}\left|x_{1}-x_{0}\right|$
于是有：
$\begin{aligned} &\left|x_{k+q}-x_{k}\right| \leq\left|x_{k+q}-x_{k+q-1}\right|+\left|x_{k+q-1}-x_{k+q-2}\right|+\ldots+\left|x_{k+1}-x_{k}\right| \\ &\leq\left(L^{q-1}+L^{q-2}+\ldots+1\right)\left|x_{k+1}-x_{k}\right|\\&<\left(1+L+L^{2}+\ldots+L^{q-1}+\ldots\right)\left|x_{k+1}-x_{k}\right|\\ &=\frac{1}{1-L}\left|x_{k+1}-x_{k}\right| \\&\leq \frac{L^{k}}{1-L}\left|x_{1}-x_{0}\right| \end{aligned}$

让 $\rightarrow \infty$ 有

$\left|x^{*}-x_{k}\right| \leq \frac{1}{1-L}\left|x_{k+1}-x_{k}\right| \leq \frac{L^{k}}{1-L}\left|x_{1}-x_{0}\right|$

于是：

$\frac{L^{k}}{1-L}\left|x_{1}-x_{0}\right| \leq \varepsilon \Rightarrow k \geq \ln \left(\varepsilon(1-L) /\left|x_{1}-x_{0}\right|\right) / \ln L$

2.3 如何加快收敛的速度

$\begin{aligned} &x_{k+1}-x^{*} \approx L\left(x_{k}-x^{*}\right) \\ &x_{k+2}-x^{*} \approx L\left(x_{k+1}-x^{*}\right) \\ &\frac{x_{k+1}-x^{*}}{x_{k+2}-x^{*}} \approx \frac{x_{k}-x^{*}}{x_{k+1}-x^{*}} \Rightarrow\quad x^{*} \approx x_{k}-\frac{\left(x_{k+1}-x_{k}\right)^{2}}{x_{k+2}-2 x_{k+1}+x_{k}}=x^{\Delta} \end{aligned}$

根据上面的思路我们可以：

$\begin{aligned}Iteration &\quad \bar{x}_{k+1}=g\left(x_{k}\right) \\ One more &\quad \hat{x}_{k+1}=g\left(\bar{x}_{k+1}\right) \\ To\, speed \,up &\quad x_{k+1}=x_{k}-\frac{\left(\bar{x}_{k+1}-x_{k}\right)^{2}}{\hat{x}_{k+1}-2 \bar{x}_{k+1}+x_{k}} \end{aligned}$

2.4 停止不定点迭代的条件

当 $L=\max _{x \in[a, b]}\left\{\left|g^{\prime}(x)\right|\right\}<1$ 时，可以使用下面的条件：

$\left|x_{\mathrm{k}+1}-x_{\mathrm{k}}\right|<\mathrm{eps}$

2.5 不动点迭代的两个缺点

很难估计 $L(\max _{x \in[a, b]}\left\{\left|g^{\prime}(x)\right|\right\})$
$L < 1$ 时无法收敛。

3. 应用：如何求解非线性方程组 $f (x) = 0$ 的解

在这里插入图片描述

3.1 二分法(Bisection Method of Bolzano)

算法的流程：

用一个区间找到一个根。
用中点分割该区间。
选择其中的一个子区间作为新的位置。

在这里插入图片描述

$\begin{aligned} &a=x_{0}, \quad b=x_{0}+h \\ &c=\frac{a+b}{2}\\ &f(a) f(b)<0, \end{aligned}$
于是：

在这里插入图片描述

$\begin{aligned} &{[{a}, {b}]\rightarrow\left[{a}_{1}, {~b}_{1}\right]\rightarrow \left[{a}_{2}, {~b}_{2}\right]\rightarrow\ldots\rightarrow\left[{a}_{{n}}, {b}_{{n}}\right]} \\ &a=a_{0} \leq a_{1} \leq \cdots \leq a_{n} \leq \cdots \leq r \leq \cdots \leq b_{n} \leq \cdots \leq b_{1} \leq b_{0}=b \end{aligned}$
定义 $r$ 是精确解。
$\begin{aligned} &\left|r-c_{n}\right| \leq \frac{b-a}{2^{n+1}}, \text { for } n=0,1,2, \ldots \\ &c_{n}=\frac{a_{n}+b_{n}}{2} \end{aligned}$

迭代次数N：

$\begin{aligned} &\left|r-c_{n}\right| \leq \frac{b-a}{2^{n+1}}<\delta \\ &2^{n+1}>\frac{b-a}{\delta} \\ &(n+1) \ln 2>\ln (b-a)-\ln \delta \\ &n+1>\frac{\ln (b-a)-\ln \delta}{\ln 2} \\ &N=\operatorname{int}\left(\frac{\ln (b-a)-\ln \delta}{\ln 2}\right) \end{aligned}$

简单地利用二分法可以判断区间内有没有零点（区间内有变号【可取最大值和最小值】）

3.2 试位法(False Position Method)

算法的流程：

用一个区间找到一个根。
以割线与X轴的交点划分区间。(过程中仍然保证端点的异号，让区间包含零点)
选择其中一个子区间作为新的位置。

$c=b-\frac{f(b)(b-a)}{f(b)-f(a)}\\ c_{1}\rightarrow c_{2}\rightarrow \ldots\rightarrow r\\ \left[a_{n}, b_{n}\right]\rightarrow [a, c]:=\left[a_{n+1}, b_{n+1}\right]$

在这里插入图片描述

缺点：在凹函数下不适用，不会收敛。

3.3 牛顿-拉夫逊方法(Newton-Raphson method)

我们知道不动点迭代，能不能用到求解非线性方程组呢？

使用泰勒展式：

$f(x_{k+1})=f\left(x_{{k}}\right)+f^{\prime}\left(x_{{k}}\right) (x_{k+1}-x_k)+{O}\left(|d|^{2}\right)=0$

于是我们可以让

$f\left(x_{\mathrm{k}}\right)+f^{\prime}\left(x_{\mathrm{k}}\right)\left(x_{{k}+1}-x_{{k}}\right)=0$

使得：

$x_{\mathrm{k}+1}=x_{{k}}-f\left(x_{\mathrm{k}}\right) / f^{\prime}\left(x_{\mathrm{k}}\right)=g(x_k)$

总结Newton-Raphson方法即：

$\begin{array}{l} f(x)=0 \\ x=g(x)=x-\frac{f(x)}{f^{\prime}(x)} \\ x_{k+1}=g\left(x_{k}\right)=x_{k}-\frac{f\left(x_{k}\right)}{f^{\prime}\left(x_{k}\right)} \end{array}$

在这里插入图片描述

我们可以证明在解的附近，Newton-Raphson方法是收敛的。

证明：

$f^{\prime}(x)$

$g^{\prime}(x)=1-\frac{f^{\prime}(x) f^{\prime}(x)-f(x) f^{\prime \prime}(x)}{\left[f^{\prime}(x)\right]^{2}}=\frac{f(x) f^{\prime \prime}(x)}{\left[f^{\prime}(x)\right]^{2}}$

我们知道不动点的条件是 $\left|g^{\prime}(x)\right|<K<1$ ，当我们取的邻域足够小，条件 $\subset[a, b]$ 会满足，注意到 $f(x^*)=0$ ，在解的邻域附近，因为 $f (x) = 0$ ，所以 $g^{'} (x) = 0$ 。

各种条件下的推导（不做要求，想了解可以看一下）

$f^{\prime}\left(x^{*}\right)>0 \text { and } f^{\prime \prime}\left(x^{*}\right)<0, \,\,\,\,g\left(\left[x^{*}-\delta, x^{*}+\delta\right]\right) \subset\left[x^{*}-\delta, x^{*}+\delta\right]$

$\begin{aligned} &x^{*}-\delta<g\left(x^{*}-\delta\right)=\left(x^{*}-\delta\right)-\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)} \\ \Leftrightarrow& 0<-\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)} \\ \Leftrightarrow &\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)}<0 \\ \Leftrightarrow &f\left(x^{*}-\delta\right)<0 \\ \Leftrightarrow &f\left(x^{*}\right)-f^{\prime}(\xi) \delta<0 【\xi\in[x^*-\delta,x^*]】\\ \Leftrightarrow&-f^{\prime}(\xi) \delta<0\\ \Rightarrow&\exists \delta_1>0, f^{\prime}(\xi)>0, \text { for } x^{*}-\xi<\delta_1 \\ \end{aligned}$
又有
$\begin{aligned} &f^{\prime \prime}\left(x^{*}\right)<0\\ \Rightarrow & \exists \delta_2>0, f^{\prime \prime}(x)<0 【保号性】\\ \Rightarrow & g^{\prime}(x)=\frac{f(x) f^{\prime \prime}(x)}{\left[f^{\prime}(x)\right]^{2}}>0, \text { for } x^{*}-x<\delta_2\\ &【\delta_2足够小，导数保号性，f'(x)>0,x<x^*,f(x^*)=0，f(x)<0】 \end{aligned}$
当 $\delta<\min\{\delta_1,\delta_2\}$ 有：
$x^{*}-\delta<g\left(x^{*}-\delta\right)<g(x), \text { for } x^{*}-x<\delta$
$f^{\prime}\left(x^{*}\right)>0 \text { and } f^{\prime \prime}\left(x^{*}\right)<0, \,\,\,\,g\left(\left[x^{*}-\delta, x^{*}+\delta\right]\right) \subset\left[x^{*}-\delta, x^{*}+\delta\right]$

$\begin{aligned} &x^{*}-\delta<g\left(x^{*}-\delta\right)=\left(x^{*}-\delta\right)-\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)} \\ \Leftrightarrow& 0<-\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)} \\ \Leftrightarrow &\frac{f\left(x^{*}-\delta\right)}{f^{\prime}\left(x^{*}-\delta\right)}<0 \\ \Leftrightarrow &f\left(x^{*}-\delta\right)<0 \\ \Leftrightarrow &f\left(x^{*}\right)-f^{\prime}(\xi) \delta<0 【\xi\in[x^*-\delta,x^*]】\\ \Leftrightarrow&-f^{\prime}(\xi) \delta<0\\ \Rightarrow&\exists \delta_1>0, f^{\prime}(\xi)>0, \text { for } x^{*}-\xi<\delta_1 \\ \end{aligned}$
又有
$\begin{aligned} &f^{\prime \prime}\left(x^{*}\right)>0\\ \Rightarrow & \exists \delta_2>0, f^{\prime \prime}(x)<0 【保号性】\\ \Rightarrow & g^{\prime}(x)=\frac{f(x) f^{\prime \prime}(x)}{\left[f^{\prime}(x)\right]^{2}}<0, \text { for } x^{*}-x<\delta_2\\ &【\delta_2足够小，导数保号性，f'(x)>0,x<x^*,f(x^*)=0，f(x)<0】 \end{aligned}$
当 $\delta<\min\{\delta_1,\delta_2\}$ 有：
$x^{*}-\delta<x^{*}=g\left(x^{*}\right)<g(x), \text { for } x^{*}-x<\delta,x<x^*$

注意Newton-Raphson方法对于单根是二阶收敛(二次收敛)【quadratic convergence】

$\left|E_{n+1}\right| \approx \frac{\left|f^{\prime \prime}(p)\right|}{2\left|f^{\prime}(p)\right|}\left|E_{n}\right|^{2}\quad n\rightarrow \infty$

证明：

而对于多重根是线性（一次）收敛，收敛速度降低。

$\left|E_{n+1}\right| \approx \frac{M-1}{M}\left|E_{n}\right |\quad n\rightarrow \infty$

证明：

如果出现了多重根 $p^*$ ，我们看到在 $f'(p^*)=0$ ，Newton-Raphson方法的分母会出现0.然而一般来说，分子 $f(p_k)$ 要比分母 $f'(p_k)$ 先出现0，所以Newton-Raphson方法一般还是可以用的。

Newton-Raphson方法的问题：

1.分母可能为0，除以零是不允许的。
2.收敛到一个不同的根，或发散。
3.产生一个循环序列。
4.产生一个发散的振荡序列。
在这里插入图片描述

由于多重根线性收敛的问题，可以考虑Newton-Raphson方法加速：
$p_{k}=p_{k-1}-\frac{M f\left(p_{k-1}\right)}{f^{\prime}\left(p_{k-1}\right)}\quad M>1$

证明：

3.4 割线法(Secant Method)

在这里插入图片描述
当Newton-Raphson的导数不好显式表达的时候，可以通过两端点的直线的斜率来近似导数。

我们有：

$x_{k+2}=g\left(x_{k}, x_{k+1}\right)=x_{k+1}-\frac{f\left(x_{k+1}\right)\left(x_{k+1}-x_{k}\right)}{f\left(x_{k+1}\right)-f\left(x_{k}\right)}$

3.5 Aitken过程加速

使用不定点的迭代，Aitken过程加速又称为史蒂芬森加速（Steffensen’s acceleration）.注意，只对一阶方法有效。

$\lim _{n \rightarrow \infty} \frac{p-p_{n+1}}{p-p_{n}}=A, \quad p \approx \frac{p_{n+2} p_{n}-p_{n+1}^{2}}{p_{n+2}-2 p_{n+1}+p_{n}}=q_{n}$

3.6 Muller方法（Muller’s method）

在这里插入图片描述
给定三个初始值 $\left(p_{0}, f\left(p_{0}\right)\right),\left(p_{1}, f\left(p_{1}\right)\right),\left(p_{2},f\left(p_{2}\right)\right)$

令
$\begin{aligned} &t=x-p_{2} \\ &h_{0}=p_{0}-p_{2}, h_{1}=p_{1}-p_{2} \\ \end{aligned}$

我们使用二次函数计算下一个点：

$y=a t^{2}+b t+c$

则有：

$\begin{aligned} t=h_{0}: a h_{0}^{2}+b h_{0}+c=f_{0} &\Rightarrow a h_{0}^{2}+b h_{0}=f_{0}-c=e_{0} \\ t=h_{1}: a h_{1}^{2}+b h_{1}+c=f_{1} &\Rightarrow a h_{1}^{2}+b h_{1}=f_{1}-c=e_{1} \\ t=0: a 0^{2}+b 0+c=f_{2}& \Rightarrow c=f_{2} \end{aligned}$

解得：

$a=\frac{e_{0} h_{1}-e_{1} h_{0}}{h_{1} h_{0}^{2}-h_{0} h_{1}^{2}}, \quad b=\frac{e_{1} h_{0}^{2}-e_{0} h_{1}^{2}}{h_{1} h_{0}^{2}-h_{0} h_{1}^{2}}$

于是得到：

$\begin{aligned} &a t^{2}+b t+c=0: \quad t=z_{1}, z_{2} \Rightarrow z_{i}=\frac{-2 c}{b \pm \sqrt{b^{2}-4 a c}} \\ &z=\arg \min \left\{\left|z_{i}\right|\right\}【\text{对于一个复数，在计算中只保留其实数部分}】 \end{aligned}$

$p_{3}=p_{2}+z$

继续得到 $\left(\bar{p}_{1}, \bar{p}_{2}, p_{3}\right)$ ，其中 $\bar{p}_{1}, \bar{p}_{2}$ 是距离 $p_3$ 最近的两个点。

4. 其他问题

4.1 如何寻找初值

例如
在这里插入图片描述
可以有两个判断条件：

【针对 $r_1$ 和 $r_2$ 】
$f\left(x_{k-1}\right) f\left(x_{k}\right)<0 \quad[{a}, {b}]=\left[{x}_{{k}-1}, {x}_{{k}}\right]$
【针对 $r_3$ 】
$\left|f\left(x_{k}\right)\right|<\varepsilon \text { 并且}\left(f\left(x_{k}\right)-f\left(x_{k-1}\right)\right) \left(f\left(x_{k+1}\right)-f\left(x_{k}\right)\right)<0\quad [{a}, {b}]=\left[{x}_{{k}-1}, {x}_{{k}+1}\right]$