Nesterov Momentum

最新推荐文章于 2024-01-07 02:03:10 发布

jiongjiongai

最新推荐文章于 2024-01-07 02:03:10 发布

阅读量1.1k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/phoenix198425/article/details/81529839

版权

机器学习专栏收录该内容

28 篇文章 0 订阅

订阅专栏

x_ahead = x + mu * v
# evaluate dx_ahead (the gradient at x_ahead instead of at x)
v = mu * v - learning_rate * dx_ahead
x += v

=>

x_prev = x
v_prev = v
x_ahead = x_prev+ mu * v_prev 
v = mu * v_prev - learning_rate * dx_ahead
x = x_prev + v
x_ahead = x + mu * v

=>

v_prev = v
x_prev = x
x_ahead_prev = x_prev + mu * v_prev
v = mu * v_prev - learning_rate * dx_ahead_prev 
x = x_prev + v
x_ahead = x + mu * v
        = x_prev + v +  mu * v
        = x_ahead_prev - mu * v_prev + (1 + mu) * v

=>

v_prev = v # back this up
v = mu * v - learning_rate * dx # velocity update stays the same
x += -mu * v_prev + (1 + mu) * v # position update changes form

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jiongjiongai

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Nesterov Momentum

x_ahead = x + mu * v# evaluate dx_ahead (the gradient at x_ahead instead of at x)v = mu * v - learning_rate * dx_aheadx += v=&gt;x_prev = xv_prev = vx_ahead = x_prev+ mu * v_prev v = mu * v_...
复制链接

扫一扫