动量法与指数加权移动平均

在 小批量梯度下降中,如果每次选取样本数量比较小,损失会呈现震荡的方式下降。

动量是模拟物理中的概念。一般而言,一个物体的动量指的是这个物体在它运动方向上保持运动的趋势,是物体的质量和速度的乘积。

当我们将一个小球从山上滚下来,没有阻力时,它的动量会越来越大(速度越来越快),但是如果遇到了阻力,速度就会变小。动量优化法 就是借鉴此思想,使得梯度方向在不变的维度上,参数更新变快,梯度有所改变时,更新参数变慢,这样就能够 加快收敛并且减少动荡

动量法移动公式

g_t 为时间步 t 的小批量数据上⽬标函数位于 x_{t-1}处的梯度 ,时间步 t 的⾃变量为 x_t,学习率为 \eta _t。 动量超参数 \gamma满⾜ 0 <= \gamma < 1。当 \gamma = 0时,动量法等价于⼩批量随机梯度下降。

要理解动量法先理解指数加权移动平均

给定

指数加权移动平均是在将当前值用他前面时间的值表示,所以动量法中当前的动量就可以用前面的动量表示,再利用当前动量影响自变量

所以说,在动量法中,我们根据 \gamma 的值,确定当前的动量是根据前多少个时间步的动量做的指数加权移动平均,利用这些数据逐渐缩小参数收敛速率。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值