各种优化算法公式快速回忆优化器-深度学习

最新推荐文章于 2021-08-26 10:20:55 发布

weixin_ry5219775

最新推荐文章于 2021-08-26 10:20:55 发布

阅读量431

点赞数

原文链接：https://blog.csdn.net/bvl10101111/article/details/72616378

版权

本文是Deep Learning 之最优化方法系列文章的RMSProp方法。主要参考Deep Learning 一书。

整个优化系列文章列表：

Deep Learning 之最优化方法

Deep Learning 最优化方法之SGD

Deep Learning 最优化方法之Momentum（动量）

Deep Learning 最优化方法之Nesterov(牛顿动量)

Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法之Adam

先上结论

1.AdaGrad算法的改进。鉴于神经网络都是非凸条件下的，RMSProp在非凸条件下结果更好，改变梯度累积为指数衰减的移动平均以丢弃遥远的过去历史。

2.经验上，RMSProp被证明有效且实用的深度学习网络优化算法。

相比于AdaGrad的历史梯度：

这里写图片描述

RMSProp增加了一个衰减系数来控制历史信息的获取多少：
这里写图片描述

这里写图片描述

再看原始的RMSProp算法:
这里写图片描述

再看看结合Nesterov动量的RMSProp，直观上理解就是：
RMSProp改变了学习率，Nesterov引入动量改变了梯度，从两方面改进更新方式。
这里写图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200326164513687.jpg)

weixin_ry5219775

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
各种优化算法公式快速回忆优化器-深度学习

本文是Deep Learning 之最优化方法系列文章的RMSProp方法。主要参考Deep Learning 一书。整个优...
复制链接

扫一扫

weixin_ry5219775 CSDN认证博客专家 CSDN认证企业博客

码龄7年

559: 原创

2088: 周排名

2万+: 总排名

142万+: 访问

: 等级

1万+: 积分

7万+: 粉丝

675: 获赞

142: 评论

3593: 收藏

私信

关注

热门文章

分类专栏

谷歌云盘大文件下载付费 1篇
其他 30篇

最新评论

使用余弦相似度算法计算文本相似度-数学
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
白话概念解释-总结1
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
docred数据集情况笔记
陆士曦: 将test抽取出的结果按照一定格式保存为文件，提交到官网，官网会给出F1分数
Pytorch - GPU ID 指定 pytorch gpu 指定
高尔琪: curr_gpuid = torch.cuda.current_device() 输出永远是0
详细通俗重点CRF层讲解
老版古董: 写得好，但是图片水印太影响了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。