Deep Learning 最优化方法之Nesterov(牛顿动量)

最新推荐文章于 2023-10-08 18:56:00 发布

This is bill

最新推荐文章于 2023-10-08 18:56:00 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习

机器学习专栏收录该内容

321 篇文章 17 订阅

订阅专栏

本文是Deep Learning 之最优化方法系列文章的Nesterov(牛顿动量)方法。主要参考Deep Learning 一书。

整个优化系列文章列表：

Deep Learning 之最优化方法

Deep Learning 最优化方法之SGD

Deep Learning 最优化方法之Momentum（动量）

Deep Learning 最优化方法之Nesterov(牛顿动量)

Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法之Adam

先上结论：

1.Nesterov是Momentum的变种。

2.与Momentum唯一区别就是，计算梯度的不同，Nesterov先用当前的速度v更新一遍参数，在用更新的临时参数计算梯度。

3.相当于添加了矫正因子的Momentum。

4.在GD下，Nesterov将误差收敛从O（1/k），改进到O(1/k^2)

5.然而在SGD下，Nesterov并没有任何改进

具体算法如下所示：
这里写图片描述

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

This is bill

CSDN认证博客专家 CSDN认证企业博客

码龄13年

457: 原创

1万+: 周排名

92万+: 总排名

423万+: 访问

: 等级

4万+: 积分

2011: 粉丝

1719: 获赞

580: 评论

4237: 收藏

私信

关注

热门文章

分类专栏

最新评论

补码与模
Z3897: 8位二进制数的模为256
为什么说“纳什均衡”改变了经济学基础理论
n_sa12: 理解纳什均衡就是对纳什最好的怀念！老师您写的这篇文章让我醍醐灌顶！我现在是学习经济学的一名本科生，看完您的分享，我才觉得自己学的是多么浅显，根本没有深入去思考，去领略理论的魅力，谢谢您的文章！！！
trie树与hash表的查找速度对比
小虾米欸: 解决了我的疑惑
补码与模
cxzxz2001: 模是符号位的权值,一句话就可以说清楚.
关于C++中公有继承、私有继承、保护继承的讨论
2301_78946266: 我运行了答主的代码，得出的结论如下：这里类P是protected继承，继承后将父类O中public F2方法的权限降为protected，而protected方法对于类的对象是无法访问的；所以类P无法访问F2。至于类Q是public继承，public F2的权限保持不变仍然为public，所以Q的对象可以访问F2.

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。