李沐72_深度学习优化算法——自学笔记

最新推荐文章于 2024-07-29 00:03:11 发布

Rrrrrr900

最新推荐文章于 2024-07-29 00:03:11 发布

阅读量393

点赞数 9

文章标签：深度学习 python pytorch 算法注意力优化注意力机制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Rrrrrr900/article/details/138311410

版权

本文讨论了在深度学习中，局部最小值与全局最小值的关系，强调凸函数优化如线性回归和softmax的优势。介绍了常见的优化算法如梯度下降、随机梯度下降和小批量随机梯度下降，以及冲量法和Adam优化器的作用，指出深度学习模型大多倾向于凸优化，小批量随机梯度下降是常用策略。

摘要由CSDN通过智能技术生成

局部最小VS全局最小

使用迭代优化算法求解，一般只能保证找到局部最小值。

凸函数优化

1.如果代价函数f是凸，且限制集合C是凸，那么就是凸优化问题，局部最小一定是全局最小

2.严格凸优化问题有唯一的全局最小

凸

1.线性回归

2.softmax

非凸

其他均是，MLP、CNN、RNN、attention…

梯度下降

最简单的迭代求解算法

随机梯度下降

比梯度下降成本低

小批量随机梯度下降

1.计算单样本的梯度很难完全利用硬件资源

冲量法

使用平滑过的梯度对权重更新，beta的常见取值[0.5,0.9,0.95,0.99]

总结

1.深度学习模型大部分是凸

2.小批量随机梯度下降是最常用的优化算法

3.冲量对梯度做平滑

4.Adam对梯度做平滑，且对梯度各个维度值做重新调整

关注

9
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李沐72_深度学习优化算法——自学笔记

1.深度学习模型大部分是凸2.小批量随机梯度下降是最常用的优化算法3.冲量对梯度做平滑4.Adam对梯度做平滑，且对梯度各个维度值做重新调整。
复制链接

扫一扫

Rrrrrr900 CSDN认证博客专家 CSDN认证企业博客

码龄5年

64: 原创

110万+: 周排名

3万+: 总排名

4万+: 访问

: 等级

1468: 积分

684: 粉丝

830: 获赞

8: 评论

447: 收藏

私信

关注

热门文章

分类专栏

文献付费 2篇

最新评论

李沐16神经网络基础——自学笔记
CSDN-Ada助手: 恭喜作者发布了第14篇博客！不断学习和分享知识是非常值得赞赏的。建议下一步可以尝试深入探讨一些实际案例，结合自己的理解和经验，给读者更多启发和思考。希望您能继续坚持创作，加油！谦虚谨慎地学习和分享是我们不断成长的不竭动力。
李沐测试15-California房价预测测试
CSDN-Ada助手: 恭喜李沐测试15在博客中分享了关于California房价预测的测试内容！持续创作是提升自己技能的不二选择，相信您的努力一定会有所收获。希望在下一篇博客中，可以深入探讨一些实际案例，或者结合更多的数据分析方法，以丰富内容吸引更多读者的关注。期待您的下一篇作品！加油！
李沐14数值稳定性_模型初始化和激活函数——自学笔记
CSDN-Ada助手: 恭喜用户在自学笔记中分享了关于李沐14数值稳定性、模型初始化和激活函数的内容。持续创作对于个人学习和分享经验都是非常有益的，希望您能继续坚持下去，为更多人带来知识的启发和帮助。建议您在下一篇博客中可以深入探讨一些实际案例，结合具体的应用场景进行分析，这样可以让读者更加直观地理解相关概念。期待您的更多精彩内容！
李沐15实战Kaggle比赛_预测房价——自学笔记
CSDN-Ada助手: 恭喜您发布了第12篇博客！看到您在自学笔记中分享了李沐15实战Kaggle比赛预测房价的经验，让人深感佩服。希望您能继续坚持创作，不断提升自己的技术水平。下一步，可以考虑分享更多具体的数据分析案例，或者挑战更多不同领域的Kaggle比赛，拓展自己的技术视野。期待看到您更多精彩的文章！
李沐06 矩阵计算
CSDN-Ada助手: 恭喜用户写了第三篇博客，标题为“李沐06 矩阵计算”！持续创作是提升自己的最好方式，希望用户能够坚持下去，不断分享自己的学习和经验。下一步建议可以尝试写一些实践性更强的文章，比如结合具体案例进行分析和总结，这样能够更好地帮助读者理解和应用知识。期待用户更加优秀的作品！愿用户在创作的路上越走越远！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。