优化算法优化器

最新推荐文章于 2022-07-28 23:44:01 发布

酸柠檬水

最新推荐文章于 2022-07-28 23:44:01 发布

阅读量267

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zr7116/article/details/93307418

版权

目录

数据量的角度 3个：

一般用的梯度下降方法：

数学角度梯度下降：

一般梯度下降：

随机梯度下降：

小批量梯度下降：

梯度下降学习率比较：

从梯度大小方向上考虑：

都是基于股票上的EMS思想（Exponential Moving Average）是指数移动平均值。动量梯度下降法 + RMSprop =Adam

动量梯度下降法：加快梯度下降

RMSprop:减少纵向摆动直面最小点加快梯度下降允许使用较大的学习率

总结：梯度决定下降方向学习率决定下降大小两者结合高效

求出某个参数梯度(偏导)形状和原始参数形状相同

数据量的角度 3个：

一般用的梯度下降方法：

随机梯度下降

adam

随机梯度下降+动量

数学角度梯度下降：

一般梯度下降：

每次要对所有数据求梯度在求平均计算量太大开销与数据成比例增长

随机梯度下降：

随机的从数据中选取一个数据计算梯度其实是对梯度的一个估计还是无偏估计

小批量梯度下降：

梯度下降学习率比较：

随机梯度下降比梯度下降更快一些

批量取得过小1 随机梯度下降不稳定在前面一段图像会抖

批量取一般：10 耗时少收敛平缓

批量取所有样本：1000 后面变化很缓形状像梯子

学习率过大最后损失可能会爆

学习率非常小：递减的非常慢收敛速度慢可能需要很多步才能达到最好的地方

从梯度大小方向上考虑：

都是基于股票上的EMS思想（Exponential Moving Average）是指数移动平均值。动量梯度下降法 + RMSprop =Adam

动量梯度下降法：加快梯度下降

RMSprop:减少纵向摆动直面最小点加快梯度下降允许使用较大的学习率

方法：对微分平方在开方

Adam是动量梯度下降法 RMSprop的结合

总结：梯度决定下降方向学习率决定下降大小两者结合高效

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

酸柠檬水 CSDN认证博客专家 CSDN认证企业博客

码龄6年

107: 原创

5万+: 周排名

230万+: 总排名

12万+: 访问

: 等级

2189: 积分

16: 粉丝

36: 获赞

5: 评论

185: 收藏

私信

关注

热门文章

分类专栏

深度学习 17篇
机器学习 24篇
python 20篇

最新评论

KD树 Java实现
_yyykkk_: 看代码是从0维开始划分，缺少了通过求每个维度的方差，确定维度划分顺序的逻辑吧？
线性表之顺序表链表
CSDN-Ada助手: 你的文章质量不错，值得学习！但还有一点小瑕疵，具体如下：(1)使用标准目录；(2)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(3)使用更多的站内链接。
KD树 Java实现
2018wl: 我在大佬的评论区瑟瑟发抖,欢迎大佬回访我的博客
KD树 Java实现
Mr_circleT: 你好，问一下，有的区间进行查询时，会报一个空指针异常的错，不知道是为什么。。。。比如，给出代码的main中测试，查询[4,3]的近邻域，就会报错

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。