凸优化简介6

最新推荐文章于 2023-08-11 18:20:45 发布

qq_36573282

最新推荐文章于 2023-08-11 18:20:45 发布

阅读量329

点赞数

文章标签：凸优化

本文链接：https://blog.csdn.net/qq_36573282/article/details/104961272

版权

本文介绍了牛顿法在寻找函数根和解决非线性方程问题中的应用，详细讨论了牛顿法的迭代公式、收敛性和不同收敛率，包括次线性、线性和二次收敛率。此外，还探讨了牛顿法在凸优化中的局限性，如矩阵逆计算可能导致的问题，并提到了变度量方法，如拟牛顿法作为替代策略。

摘要由CSDN通过智能技术生成

文章目录

牛顿法

牛顿法

1. 牛顿法分析

牛顿法是寻找单变量函数根的方法。设函数 $\rightarrow R, f(t^*)=0$ 。牛顿法基于线性逼近，假定有和 $t^*$ 足够接近的 $t$ ，则使用泰勒展开式得到 $f(t+\Delta t)=f(t)+f'(t)\Delta t+o(|\Delta t|)$ 。因此，等式 $f(t+\Delta t)=0$ 可以使用线性等式 $f(t)+f'(t)\Delta t=0$ 来逼近。期望最优位移 $\Delta t^*=t^*-t$ 是一个好的逼近，则结合上面的线性逼近等式可以得到对 $t$ 的更新 $t_{k+1}=t_k-\frac{f(t_k)}{f'(t_k)}$ 。
进一步的，将这种方法扩展到寻找非线性方程的解 $x\in \mathbb{R}^n, F(x):\mathbb{R^n}\rightarrow \mathbb{R}^n$ 。类比上面的线性等式，可以写出针对非线性方程的一个等式 $F(x)+J_{F}(x)\Delta x=0$ ，称为牛顿方程组。如果雅可比矩阵 $J_F(x)$ 是可逆的，则类比线性的情况可以得到关于位移的等式 $\Delta x=-[F'(x_k)]^{-1}F(x_k)$ ，迭代中更新 $x$ 的公式为 $x_{k+1}=x_{k}-[J_F(x_k)]^{-1}F(x_k)$ 。
由于函数的极小值处 $\nabla f(x)=0$ （可能不是全局的最小值），因此，类别上面的方法，得到关于 $\Delta x$ 一个等式 $\nabla f(x)+\nabla^2f(x)\Delta x=0$ ，因此在迭代中更新的方法为 $x_{k+1}=x_k-[\nabla^2 f(x_k)]^{-1}\nabla f(x_k)$ 。
在严格局部最小的邻域内起始，牛顿方法收敛很快。但是由于在迭代中使用到了雅可比矩阵的逆，因此如果在迭代中可能出现矩阵不可逆的问题；此外，牛顿方法有可能发散。
例如，函数 $f(x)=\frac{x}{\sqrt{1+x^2}}$ ，则 $f'(x)=\frac{1}{(1+x^2)^{\frac{3}{2}}}$ ，应用上面的迭代公式得到 $x_{k+1}=x_k-\frac{f(x)}{f'(x_k)}=-x^3_{k}$ . 因此，如果初始点 $x_0| < 1$ 则算法会收敛到是的函数达到极小值的 $x^*=0$ ，但是如果初始点 $x_0|> 1$ ，则该方法会发散。因此，为了避免发散，可以使用阻尼牛顿方法，即加上一个学习率 $x_{k+1}=x_{k}-h_k[\nabla^2 f(x_k)]^{-1}\nabla f(x_k)$ 。关于步长可以比较凸优化简介5中的梯度方法。
下面分析一下牛顿法的收敛性，假设 $f\in C_{M}^{2,2}(\mathbb{R}^n)$ ，且函数 $f$ 存在局部的极小值，且Hessian 矩阵是正定的 $\nabla^2 f(x^*) \succeq lI_n, l > 0$ ，并且假设初始点 $x_0$ 和 $x^*$ 足够的近。
在上面的迭代公式

最低0.47元/天解锁文章

qq_36573282

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
凸优化简介6

文章目录牛顿法1. 牛顿法分析2. 不同收敛率的分析2.1 次线性收敛率2.2 线性收敛率2.3 二次收敛率3. 局部方法4. 变度量方法5. 总结牛顿法1. 牛顿法分析牛顿法是寻找单变量函数根的方法。设函数 f(t):R→R,f(t∗)=0f(t): R \rightarrow R, f(t^*)=0f(t):R→R,f(t∗)=0。牛顿法基于线性逼近，假定有和t∗t^*t∗足够接近的tt...
复制链接

扫一扫