深度学习基础知识总结

最新推荐文章于 2022-01-05 16:29:38 发布

eryihahaha

最新推荐文章于 2022-01-05 16:29:38 发布

阅读量152

点赞数

分类专栏：算法文章标签：深度学习

原文链接：https://www.cnblogs.com/guoyaohua/p/8542554.html

版权

算法专栏收录该内容

19 篇文章 1 订阅

订阅专栏

1.优化算法

Momentum

Momentum 在更新参数的时候没有直接使用当前导数，而是用的指数平均值将历史的导数做了记录，并且当前的权重的最大的，之前的依次递减

超参数设定值: 一般 γ 取值 0.9 左右。

优点：
可以使得梯度方向不变的维度上速度变快，梯度方向有所改变的维度上的更新速度变慢，这样就可以加快收敛并减小震荡。

Nesterov Accelerated Gradient

在这里插入图片描述

Adagrad （Adaptive gradient algorithm）
这个算法就可以对低频的参数做较大的更新，对高频的做较小的更新，也因此，对于稀疏的数据它的表现很好，很好地提高了 SGD 的鲁棒性

这个算法与上一个属于同一类，不过坟分母使用的指数平均值所以解决了学习率急剧下降的问题

3. Adam

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。