信赖域算法原理

LLand520

于 2019-09-29 13:34:00 发布

阅读量3.5k

点赞数 1

文章标签：编程程序员 Python

本文链接：https://blog.csdn.net/LLand520/article/details/101686471

版权

本文介绍了信赖域算法在最优化方法中的应用，通过对比梯度下降法和牛顿法，阐述了信赖域方法的基本原理。算法首先在当前点进行泰勒展开，然后在确定的步长范围内寻找最小值点，通过比较实际下降值和预测下降值来调整步长，以逐步逼近损失函数的最小值。信赖域半径的更新规则旨在确保近似函数与原始函数的误差在可控范围内，从而加速收敛过程。

摘要由CSDN通过智能技术生成

提到最优化方法，常见的有梯度下降法（衍生出来的有批梯度下降，随机梯度下降）、牛顿法（衍生出来了拟牛顿）等。我们知道，最优化在机器学习中，是为了优化损失函数，求得其最小值，即为(mathop {min }limits_theta f({x_theta }))，其中 (theta) 为损失函数的参数，最优化的目的就是找到最佳的(theta)使得损失函数最小。梯度下降的方法是求出损失函数在某一点的梯度，然后沿着负梯度方向走一小步，然后继续求新点的梯度，继续的迭代，直到达到迭代限定的次数，或者梯度极小，则迭代结束，求得最小值。对于牛顿法的原理，这里简单推导下: 先用泰勒展开去逼近目标函数(f(x))即为 [varphi (x) = f({x_k}) + f’({x_k})(x - {x_k}) + frac{1}{2}f’’({x_k}){(x - {x_k})^2}] (phi (x))是二阶展开式，高阶项被略去，既然我们把其当做目标函数的逼近式，则我们对该函数求最值，那么采用的方法就是求出展开后的二次逼近式的导数，然后另其等于0，即如下： [varphi ‘(x) = 0,] [f’({x_k}) + f’’({x_k})(x - {x_k}) = 0] 然后得出 [x = {x_k} - frac{f’({x_k})} {f’’({x_k})}] 这里我们感性的理解下这种思路，我们知道，当函数在点(x_k)泰勒展开时，取其前几阶式（牛顿法取的是二阶）用于逼近原始的函数，那么只有在展开的那个点附近，才能用泰勒展开的式子作为近似原始函数，因为我们取的毕竟是有限的阶数（高阶的我们已省略），那