之前学不动点迭代法的时候,一直有一个疑惑,就是为什么不动点迭代最后可以收敛到两个函数之间的交点,为什么只要不断代入得到的收敛序列就是方程的解?感谢视频
→
\to
→不动点迭代详解,让作者终于理解了不动点迭代法
文章目录
一、不动点迭代法介绍
初等数学中的方程都可以写作
f
(
x
)
=
0
(1-1)
f(x)=0\tag{1-1}
f(x)=0(1-1)
经过一些简单的改写便可以得到
x
=
φ
(
x
)
(1-2)
x=\varphi(x)\tag{1-2}
x=φ(x)(1-2)
如果有
x
∗
x^*
x∗满足方程
(
1
−
2
)
(1-2)
(1−2),则称
x
∗
x^*
x∗为该方程的一个不动点,那么求方程
(
1
−
1
)
(1-1)
(1−1)的解也就是求
f
(
x
)
f(x)
f(x)的零点,便等价于求
φ
(
x
)
\varphi(x)
φ(x)的不动点。
我们从初始的
x
0
x_0
x0出发,构造迭代
x
n
+
1
=
φ
(
x
n
)
x_{n+1}=\varphi(x_n)
xn+1=φ(xn)
也就是不断地将上一个
x
x
x代入
φ
(
x
)
\varphi(x)
φ(x)中,以获得下一个
x
x
x,这样我们就可以获得一个序列
{
x
n
}
\{x_n\}
{xn},如果该序列是收敛的,那么便会收敛到方程
(
1
−
1
)
(1-1)
(1−1)的解。
二、几何意义
我本人最大的疑惑就是,为什么将上一个点不断代入到 φ ( x ) \varphi(x) φ(x)中,所得到的收敛序列的极限一定是方程 ( 1 − 1 ) (1-1) (1−1)的解呢?
观察上图可以知道,实际上求不动点就是在求 y = φ ( x ) y=\varphi(x) y=φ(x)和 y = x y=x y=x的交点,而不动点迭代法的步骤如下
- 首先将 x 0 x_0 x0代入 φ ( x ) \varphi(x) φ(x)中获得一个点,以相同的 y y y值对应到直线 y = x y=x y=x上,由于 y = x y=x y=x的横纵坐标相同,我们就可以轻松获得 x 1 = φ ( x 0 ) x_1=\varphi(x_0) x1=φ(x0)
- 重复上述步骤, x x x值将会不断逼近不动点(交点)
从上面的图可以看出来,实际上序列 { x n } \{x_n\} {xn}在以螺旋逼近的思想趋近于交点,最终数列的极限就是 φ ( x ) \varphi(x) φ(x)的不动点。