关于梯度下降法的一些优化方法

最新推荐文章于 2023-03-24 15:45:33 发布

白小李

最新推荐文章于 2023-03-24 15:45:33 发布

阅读量732

点赞数

文章标签：大数据深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gldzkjdxwzs/article/details/125818280

版权

目录

梯度下降法的优化

随机梯度下降法（min-bitch）

优化下降的路径(牛顿法)

动量法（冲量法）

梯度下降法的优化

调整神经网络结构，增加池化层，或者dropout

算法优化，如随机梯度下降、牛顿法、动量法、Nesterov、AdaGrad、RMSprop、Adam

随机梯度下降法（min-bitch）

本质：减少每一次计算的计算量，

在原来的计算中是把整个训练集都计算一遍，在随机梯度下降法中，随机挑选一个数据，用这个数据计算，最后修改参数值，在下一次训练中，再随机挑一个数据再次训练，通过如此不断将参数收敛到极值点。

在凸问题这样的问题下，k代表迭代了k次，f星代表的是那个极值点，经过k次训练后，最后随机梯度下降法能达到的那个误差是根号k分之一这个量级的。

在强凸问题下，它的收敛还会更快，达到k分之一这个量级。

在正常情况下，标准的梯度下降法的收敛速度是要比随机梯度下降法快，但经过科学家证明，再快也不会块多k分之一。即总得来看，梯度下降法的效率和性价比不是很高，即直接选择用随机梯度下降法。

优化下降的路径(牛顿法)

本质：用更少的步数，更快地到达极值点。

学习步长由学习率决定，如果步长太长了，下一个更新到的节点就是箭头指向的位置，但此时B点的最快下降方向不是箭头的这个方向了，即这个下降路径不是最优的。若减少学习的步长，虽然可以贴近完美下降路径，但增加了学习的步数，增大了计算量。

保证一定的学习步长，又可以贴近最优下降路径。

上图中灰色的曲线是到极值点最优的路线，橙色直线离极值点是有偏差的，距离越远，偏差越大。绿色抛物线在一定范围内是优于这条直线的，当这个抛物线取值到顶点时效果是最好的，当按照抛物线来进行学习的话，它的步长达到x时，它的学习效果是最好的。

数学表达：

缺陷：计算量大，实际中难以运用。

动量法（冲量法）

绿色路径上下震动减少了，横向跨度增加了。利用历史数据去修正分量，比如在第一个箭头点，计算出的梯度在纵轴的分量同历史的数据相比较，历史上纵轴的分量是向下的，跟它相反，则它会减少这个维度上的量，若方向相同，则加大步长。

将历史的数据添加进来。

缺陷：步数够多的话，前所有的历史数据都要全部考虑，其中包括一些没参考价值的数据。

Nesterov方法

超前参考未来的数据。

AdaGrad方法

让学习率实现自适应，其中是通过历史数据。

在学习率η下除了一个数值，这个数值是历史上所有梯度的内积开方。历史数据修改的多，则η学习率减少的也就越多。

学习到的梯度是真实梯度除以梯度内积的开方。adagrad本质是解决各方向导数数值量级的不一致而将梯度数值归一化

适合稀疏数据（训练集中的两个数据，它们之间的不同更多的是体现在特征的不同，而不是体现在某一个具体特征上的程度不一样）。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
关于梯度下降法的一些优化方法

梯度下降
复制链接

扫一扫

白小李 CSDN认证博客专家 CSDN认证企业博客

码龄5年

50: 原创

39万+: 周排名

28万+: 总排名

3万+: 访问

: 等级

528: 积分

62: 粉丝

16: 获赞

8: 评论

76: 收藏

私信

关注

热门文章

最新评论

2023/4/16周报
可盐可甜~: 请问能给出复现的完整代码吗？
实现卷积的几种代码方式
慧831: 能否还原出CNN的全部代码呢
2023/4/9周报
sun_meng_: 想看看这篇论文楼主能给个论文名字吗？
对于CNN的文献阅读和识别手写数字的复现
qq_41178994: 您好，请问《基于深度卷积神经网络的大气湍流相位提取》这篇论文，您进行复现了嘛，我复现的结果与论文有些差距，请问可以请教您一些问题嘛？谢谢
2023/4/2周报
七扭八拐: 博主请问这篇GNN-RNN的论文题目是什么呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。