Deep Learning 最优化方法之AdaGrad

最新推荐文章于 2024-09-19 06:30:00 发布

BVL10101111

最新推荐文章于 2024-09-19 06:30:00 发布

阅读量2.1w

点赞数 10

分类专栏： dl 文章标签：深度学习优化

本文链接：https://blog.csdn.net/BVL10101111/article/details/72616097

版权

dl 专栏收录该内容

27 篇文章 14 订阅

订阅专栏

本文是Deep Learning 之最优化方法系列文章的AdaGrad方法。主要参考Deep Learning 一书。

整个优化系列文章列表：

Deep Learning 之最优化方法

Deep Learning 最优化方法之SGD

Deep Learning 最优化方法之Momentum（动量）

Deep Learning 最优化方法之Nesterov(牛顿动量)

Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法之Adam

先上结论：

1.简单来讲，设置全局学习率之后，每次通过，全局学习率逐参数的除以历史梯度平方和的平方根，使得每个参数的学习率不同

2.效果是：在参数空间更为平缓的方向，会取得更大的进步（因为平缓，所以历史梯度平方和较小，对应学习下降的幅度较小）

3.缺点是,使得学习率过早，过量的减少

4.在某些模型上效果不错。

具体见算法：
这里写图片描述