机器学习与深度学习系列连载：第二部分深度学习（四）深度学习技巧1（Deep learning tips- RMSProp + Momentum=Adam）

最新推荐文章于 2023-10-17 14:48:03 发布

人工智能插班生

最新推荐文章于 2023-10-17 14:48:03 发布

阅读量806

点赞数

分类专栏：深度学习神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dukuku5038/article/details/83680923

版权

深度学习同时被 3 个专栏收录

53 篇文章 9 订阅

订阅专栏

51 篇文章 1 订阅

订阅专栏

25 篇文章 82 订阅

订阅专栏

深度学习技巧（Deep learning tips1）

深度学习中我们总结出5大技巧：
在这里插入图片描述

我们先从Adaptive Learning Rate 谈起，我Gradient Decent 中我们已经讨论了：
AdaGrad ：
在这里插入图片描述

紧着AdaGrad的步伐，我们进一步看：

1.RMSProp

神经网络训练的时候，Error Surface 很有可能非常复杂
在这里插入图片描述
RMSProp其实和AdaGrad 是一样的思路，但是具体求分母的时候，它考虑了历史gradient和新的g的权重a 。

2. Momentum

如何找到最优的网络参数呢？
optimize loss 的时候，很有可能就会遇到如下三大问题：

慢 very slow
局部最优 local minimal
鞍点 saddle point

我们可以考虑在物理世界的场景进行映射：小球从山上滑落，在局部最低的时候，他的动量让它冲出局部。
在这里插入图片描述

我们复习一下梯度下降：Gradient的方向和Movement 的方向相反
在这里插入图片描述

当我们考虑运动的动量后：
运动不在是基于梯度，而是基于以前的运动
Movement not just based on gradient, but previous movement.

在这里插入图片描述
其中 movement = laststep of movement - present gradient

Momentum 虽然不能保证走出“困境”，但是这是一个巨大的进步
在这里插入图片描述

3. Adam 算法

Adam 算法是结合 RMSProp 和 Momentum，来寻找最优解。看起来比较复杂，
实际上懂 RMSProp 和 Momentum后，也就很快理解了。
在这里插入图片描述

本专栏图片、公式很多来自台湾大学李弘毅老师、斯坦福大学cs229，斯坦福大学cs231n 、斯坦福大学cs224n课程。在这里，感谢这些经典课程，向他们致敬！

人工智能插班生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习与深度学习系列连载：第二部分深度学习（四）深度学习技巧1（Deep learning tips- RMSProp + Momentum=Adam）

深度学习技巧（Deep learning tips1）深度学习中我们总结出5大技巧：我们先从Adaptive Learning Rate 谈起，我Gradient Decent 中我们已经讨论了：AdaGrad ：紧着AdaGrad的步伐，我们进一步看：1.RMSProp神经网络训练的时候，Error Surface 很有可能非常复杂RMSProp其实和AdaGrad 是一样...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。