深度学习-优化策略

借180

于 2024-04-21 21:27:44 发布

阅读量430

点赞数 7

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62737318/article/details/138044870

版权

1.使用众所周知的梯度下降法。

（1）.批量梯度下降法：每次参数更新使用所有的样本（2）.随机梯度下降法：每次参数更新只使用一次样本（3）.小批量梯度下降法：每次参数更新使用小部分数据样本

优点：算法简洁，当学习率值恰当时，可以收敛到全局最优点或局部最优点。

缺点：对于超参数比较敏感：过小导致收敛速度过慢，过大容易越过极值点；无法实时修改学习率，容易出现在鞍点上，处于局部最大值；且求导时要对整个数据集进行求导，计算量很大；且容易达到局部最优点，无法继续优化。

2.随机梯度下降法，在梯度下降上做了优化，优点是：计算量小，因为只需要对一个训练数据进行求导。缺点：无法调整学习率，容易发生震荡，收敛慢，容易出现在鞍点上，处于局部最大值。

3.动量法momentum，优点：加上了原始动量（梯度累积）且对于变量给了参数，给了一种惯性，使得其在正确的方向上，下降更快，而且容易跳出局部最小点。更具有鲁棒性，使得训练过程更加平稳。缺点：容易出现在鞍点上，处于局部最大值。

更新的时候用的不再是梯度，而是参数的动量值。

以上是对梯度做文章，

4.adagrad（自适应学习率优化器）

对于不同的参数设置不同的学习率，

使用累计平方梯度来计算新的学习率（让其作为平方根，且为分母）这样就能在梯度与学习率相乘的时候能够自适应。

优点：可以自适应的调整学习率，不同量级的参数能更好的收敛（使得梯度大的学习率变小，使得梯度乘以学习率后为一个可以接受的值，能够减少震荡）。

5.RMSProp

优点：给累计梯度增加了参数，学习率进一步优化，给累计梯度和和当前梯度增加参数，计算公式不变。

以上是对学习率做文章

6.adam

缝合怪，集中了以上所有的优点，在梯度方面增加了momentum，使用累计梯度。同时在学习率上能够自适应使用RMSProp的优点。其中的参数均为超参数，需要自己去调整。最后使用了偏差纠正，起初的时候累计梯度和累计平方梯度都是属于0，而参数会接近于一，那么当t较小时，可能会偏向于0。那么就需要做偏差矫正。

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
深度学习-优化策略

3.动量法momentum，优点：加上了原始动量（梯度累积）且对于变量给了参数，给了一种惯性，使得其在正确的方向上，下降更快，而且容易跳出局部最小点。缺点：无法调整学习率，容易发生震荡，收敛慢，容易出现在鞍点上，处于局部最大值。优点：可以自适应的调整学习率，不同量级的参数能更好的收敛（使得梯度大的学习率变小，使得梯度乘以学习率后为一个可以接受的值，能够减少震荡）。优点：给累计梯度增加了参数，学习率进一步优化，给累计梯度和和当前梯度增加参数，计算公式不变。更新的时候用的不再是梯度，而是参数的动量值。
复制链接

扫一扫

借180 CSDN认证博客专家 CSDN认证企业博客

码龄3年

45: 原创

116万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

970: 积分

389: 粉丝

494: 获赞

4: 评论

310: 收藏

私信

关注

热门文章

最新评论

深度学习-优化策略
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
cnn卷积神经网络
借180: https://pytorch.org/get-started/previous-versions/
cnn卷积神经网络
借180: conda install pytorch==1.6.0 torchvision==0.7.0 cudatoolkit=10.1
cnn卷积神经网络
借180: conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1
鸿蒙开发-第三方库axios
CSDN-Ada助手: “恭喜博主发布了第19篇博客，内容涉及到鸿蒙开发中的第三方库axios，对鸿蒙开发者来说是非常有价值的内容。希望博主能够继续坚持创作，为大家分享更多有关鸿蒙开发的知识和经验。建议博主在接下来的创作中，可以考虑结合实际案例或者开发经验，为读者提供更具体的指导和帮助。期待博主的更多精彩作品。”

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。