牛顿法

最新推荐文章于 2022-05-23 17:25:36 发布

michaelhan3

最新推荐文章于 2022-05-23 17:25:36 发布

阅读量1.6k

点赞数

分类专栏：数学基础

本文链接：https://blog.csdn.net/michaelhan3/article/details/82688646

版权

数学基础专栏收录该内容

18 篇文章 4 订阅

订阅专栏

牛顿法是一种在实数域和复数域上近似求解方程的方法。方法使用函数f (x)的泰勒级数的前面几项来寻找方程f (x) = 0的根，也可以用于求函数的极小值。牛顿法最大的特点就在于它的收敛速度很快。

　　具体步骤：

　　首先，选择一个接近函数 f (x)零点的 x0，计算相应的 f (x0) 和切线斜率f ' (x0)（这里f ' 表示函数 f 的导数）。然后我们计算穿过点(x0, f (x0)) 并且斜率为f '(x0)的直线和 x 轴的交点的x坐标，也就是求如下方程的解：

　　我们将新求得的点的 x 坐标命名为x1，通常x1会比x0更接近方程f (x) = 0的解。因此我们现在可以利用x1开始下一轮迭代。迭代公式可化简为如下所示：

　　已经证明，如果f ' 是连续的，并且待求的零点x是孤立的，那么在零点x周围存在一个区域，只要初始值x0位于这个邻近区域内，那么牛顿法必定收敛。并且，如果f ' (x)不为0, 那么牛顿法将具有平方收敛的性能. 粗略的说，这意味着每迭代一次，牛顿法结果的有效数字将增加一倍。下图为一个牛顿法执行过程的例子。

　　由于牛顿法是基于当前位置的切线来确定下一次的位置，所以牛顿法又被很形象地称为是"切线法"。牛顿法的搜索路径（二维情况）如下图所示：

　　牛顿法搜索动态示例图：

关于牛顿法和梯度下降法的效率对比：

　　从本质上去看，牛顿法是二阶收敛，梯度下降是一阶收敛，所以牛顿法就更快。如果更通俗地说的话，比如你想找一条最短的路径走到一个盆地的最底部，梯度下降法每次只从你当前所处位置选一个坡度最大的方向走一步，牛顿法在选择方向时，不仅会考虑坡度是否够大，还会考虑你走了一步之后，坡度是否会变得更大。所以，可以说牛顿法比梯度下降法看得更远一点，能更快地走到最底部。（牛顿法目光更加长远，所以少走弯路；相对而言，梯度下降法只考虑了局部的最优，没有全局思想。）

　　根据wiki上的解释，从几何上说，牛顿法就是用一个二次曲面去拟合你当前所处位置的局部曲面，而梯度下降法是用一个平面去拟合当前的局部曲面，通常情况下，二次曲面的拟合会比平面更好，所以牛顿法选择的下降路径会更符合真实的最优下降路径。

注：红色的牛顿法的迭代路径，绿色的是梯度下降法的迭代路径。

牛顿法的优缺点总结：

　　优点：二阶收敛，收敛速度快；

　　缺点：牛顿法是一种迭代算法，每一步都需要求解目标函数的Hessian矩阵的逆矩阵，计算比较复杂。

牛顿法用于求最优值

通常如果一个函数可以表示为 $y = f(x)$ , 如果为了求y的最小值得时候的x的值，一个通常的做法是求导，令倒数等0，这是高中的知识。OK ，但是很多时候这个函数倒数为0的点很难求出，或者说解析式比较复杂，那么我们就可以用类似求方程的0根的方法来求这个使得倒数为0的x值。

已知：y = f(x)

求：y取最小值时候x的值

解： $y' = f' (x)$ , 令 , 求得x的值一般就是所求的值。

令

所以 就是 g(x) = 0, 根据上面利用牛顿法求方程的0根解，可以知道 $x_{n+1} = x_{n} - g(x) / {g}' (x) = x_{n} - {f}'(x) / {f}'' (x)$

如此反复迭代就行了。

michaelhan3

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
牛顿法

牛顿法是一种在实数域和复数域上近似求解方程的方法。方法使用函数f (x)的泰勒级数的前面几项来寻找方程f (x) = 0的根，也可以用于求函数的极小值。牛顿法最大的特点就在于它的收敛速度很快。　　具体步骤：　　首先，选择一个接近函数 f (x)零点的 x0，计算相应的 f (x0) 和切线斜率f ' (x0)（这里f ' 表示函数 f 的导数）。然后我们计算穿过点(x0, f (x...
复制链接

扫一扫

专栏目录