RMSProp优化算法

最新推荐文章于 2024-07-09 20:43:53 发布

weixin_37958272

最新推荐文章于 2024-07-09 20:43:53 发布

阅读量601

点赞数

分类专栏：深度学习优化算法文章标签：神经网络算法深度学习人工智能

深度学习优化算法专栏收录该内容

12 篇文章 2 订阅

订阅专栏

RMSProp优化算法

参考：【优化算法】一文搞懂RMSProp优化算法

而本文要介绍的RMSProp优化算法是AdaGrad算法的一种改进。

首先给出AdaGrad算法：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sblAmBQY-1593961074219)(025.jpg)]

再抛出原始的RMSProp算法:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FDPK3mBV-1593961074221)(026.jpg)]

可以看出RMSProp优化算法和AdaGrad算法唯一的不同，就在于累积平方梯度的求法不同。RMSProp算法不是像AdaGrad算法那样暴力直接的累加平方梯度，而是加了一个衰减系数来控制历史信息的获取多少。见下：

1.AdaGrad算法的改进。鉴于神经网络都是非凸条件下的，RMSProp在非凸条件下结果更好，改变梯度累积为指数衰减的移动平均以丢弃遥远的过去历史。

2.经验上，RMSProp被证明有效且实用的深度学习网络优化算法。

相比于AdaGrad的历史梯度：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kEkYIVBm-1593961074221)(028.jpg)]

直观理解作用

简单来讲，设置全局学习率之后，每次通过，全局学习率逐参数的除以经过衰减系数控制的历史梯度平方和的平方根，使得每个参数的学习率不同

那么它起到的作用是什么呢？

参数的学习率不同**

那么它起到的作用是什么呢？

起到的效果是在参数空间更为平缓的方向，会取得更大的进步（因为平缓，所以历史梯度平方和较小，对应学习下降的幅度较小），并且能够使得陡峭的方向变得平缓，从而加快训练速度。

weixin_37958272

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。