深度学习之梯度下降算法

Bobbyeyy

于 2023-07-26 11:14:53 发布

阅读量1.1k

点赞数

文章标签：深度学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chunghyyn/article/details/131933439

版权

本文介绍了线性模型和使用MSE作为评价指标，探讨了梯度下降算法在寻找最小误差时的作用，以及它在非凸函数中可能陷入局部最优的问题。文章还提到了随机梯度下降（SGD）和批量随机梯度下降（mini-batchSGD）作为优化策略，以解决梯度下降的局限性并提高训练效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0.1 学习视频源于：b站：刘二大人《PyTorch深度学习实践》

0.2 本章内容为自主学习总结内容，若有错误欢迎指正！

1 线性模型

1.1 通过简单的线性模型来举例：

1.2 如图，简单的一个权重的线性模型，首先通过随机取w的值来找到与true line重合的w，其中通过MSE来判断w取值是否合理。（最简单的通过评价指标来判断模型的效果如何）

1.3 但是对于多个权重来说，搜索权重w的数量呈幂函数增长。此时可以想到分治方法，通过分治法减少首次搜索次数，找到MSE较小的点在进行一定区间范围内的权重w搜索。但是这种方法对于大部分的MSE曲线（不规则，非凸函数），会因为第一轮的分治取值不当导致错过最优点。

2 梯度下降

2.1 所以引入梯度下降算法寻找最小MSE值。

2.2 Q:什么是梯度？A:cost函数（本文为MSE）对权重求导。

2.3 梯度下降更新权重的方法：

（减去学习率×导数，是因为如果寻找的导数为负值，说明该区间曲线递减，则w向后取值即w数值增加；如果为正，说明该区间曲线递增，则w向前取值即w数值减少。学习率：一般取值不宜太大，其控制MSE曲线上所取的w的跨越程度，学习率取值太大容易导致cost函数发散。）

2.4 梯度下降为贪心算法，由于非凸函数存在多个最优点（局部最优），所以梯度下降算法很难找到全局最优，容易陷入局部最优点，但是在深度神经网络中并没有太多的局部最优点，即很难陷入局部最优，所以梯度下降算法依然被大量使用。同时梯度下降算法存在鞍点问题（梯度为0）。

2.5 可以通过指数加权均值平滑cost函数，这样更容易观察曲线趋势。

3 随机梯度下降

3.1 cost在本文中指MSE（所有样本的平均损失），而loss是指单个样本的损失。利用单个样本的loss函数之后增加了随机噪声，可以很大程度上解决鞍点问题。

3.2 梯度下降算法每个点的损失计算是可以并行的，但是随机梯度下降算法w的更新依赖于上次w更新的结果。所以梯度下降算法效率更高，随机梯度算法性能更好但是时间复杂度太高。

3.3 因此折中引入batch（mini-batch）（批量随机梯度下降）。随机梯度下降法（stochasticgradientdescent，SGD）算法默认使用批量随机梯度下降方法。

博客等级

码龄6年

82
原创

3
点赞

5
收藏

4
粉丝

关注

私信

热门文章

上一篇：: Day 66-68 主动学习之ALEC

下一篇：: Day 69-70：矩阵分解

最新评论

DL-FWI：数据（第二次培训作业）
lpw1731897920: 您好，请问这个培训在哪看？
DL-FWI：简述（总结反演培训第一次课内容）
lpw1731897920: 请问这是什么培训啊，有视频资源吗
Day 3
CSDN-Ada助手: 恭喜你，坚持写作已经到了第三天，这是一个了不起的成就。我建议你可以继续坚持写作，多尝试不同的主题和风格，这样你会有更多的收获。同时，也可以多参与社区的活动，和其他作者互动交流，相信你会有更多的启发和灵感。再次祝贺你，期待你的下一篇作品。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
Day 4
CSDN-Ada助手: 恭喜你写了第四篇博客！持续创作不易，你已经走了很远的路。接下来，我建议你可以尝试更深入的探索你感兴趣的主题，或者从不同的角度去思考问题，这样可以让你的博客更加丰富多彩。继续加油！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
Day 1
CSDN-Ada助手: 恭喜你开始创作博客啦！Day 1，虽然只是一个开始，但是每一步都是很重要的。期待看到你的更多作品，继续加油哦！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。