机器学习11：Tips of DNN——改进梯度下降

最新推荐文章于 2022-07-19 11:56:55 发布

勤睿

最新推荐文章于 2022-07-19 11:56:55 发布

阅读量417

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qqqinrui/article/details/84887638

版权

机器学习专栏收录该内容

25 篇文章 4 订阅

订阅专栏

一、Adagrad

Adagrad方法是一种自适应的梯度下降方法，原始模型中的梯度为 $\eta\frac{first derivative}{second derivative}$ ，Adagrad使用一次偏导估计二次偏导，如下：

它可以自适应如下椭圆两个方向的梯度下降情况：

二、RMSProp（Adagrad的进阶版）

考虑更复杂的情况：

RMSProp对Adagrad的分母项进行了改进，它对平方和中的前面项与当前项加了权重。通过调整 $\alpha$ 值，调整当前位置的偏导数与之前位置偏导数的权重得到更灵活的梯度方法。

三、Momentum

梯度下降可能会陷入Local minimum，包括梯度接近于0的位置：

借鉴物理中的小球滚动过程惯性的特征对梯度增加正则化项，只要在Local Minimum出不出现很陡的上坡，都有可能向前寻找更低点。

梯度最终决定于所有走过位置偏导的加权。即使当前的偏导为0（Local Minumum），由于惯性（以前的偏导还起作用），会继续向前走

四、Adam

Adam的实质是RMSProp与Momentum的组合

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。