Nesterov加速梯度下降算法

       Nesterov加速梯度下降法是梯度下降法的一个改进的版本。Nesterov在1983年首次提出,人们已经证明加速梯度算法是所有基于梯度算法(或者说一阶)算法中最好的算法之一。然而原始的梯度下降算法仅仅能处理光滑的“凸”优化问题。最新的进展是,将加速梯度下降法拓展到了更广泛类型的“凸”优化问题。Nesterov加速梯度下降法在梯度下降法的基础上,通过结合动量法的思想,优化了寻优的效率。

       Nesterov加速梯度下降算法由两步组成:第一步沿着前两步的计算方向计算一个新点,第二步在该新点处做一步近似点梯度迭代,即

        下图给出Nesterov加速梯度下降算法的迭代序列图。

       可以看到这一做法对每一步迭代的计算量几乎是没有影响的,而带来的效果却是显著的。

注:该方法与梯度下降法一样简单;唯一复杂的是上式中的一种线搜索。事实上,如果没有提前给出目标梯度的Lipschitz常数(当然,实际上从来没有提前给出),那么梯度下降中应该使用相同的线搜索(类似于所谓的Armiljo-Goldstein规则)。

       Nesterov加速梯度下降算法的步骤如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值