（12） pytorch之优化器

最新推荐文章于 2025-02-11 21:43:30 发布

璐晓璐

最新推荐文章于 2025-02-11 21:43:30 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39029495/article/details/111567312

本文详细介绍了PyTorch中的优化器，包括优化器的作用、优化器的更新过程，以及如何在PyTorch中使用SGD和其他常用优化器如Adam。优化器通过损失函数的梯度来更新模型参数，以最小化损失。特别是，文章讲解了SGD的基本属性，如参数管理、学习率和动量，并提到了如何添加参数组以及优化器的状态管理。最后，提到了Adam优化器作为另一个常用的选项。

一、优化器：利用损失函数的梯度，更新模型参数，使得损失变小

1.导数：函数再指定坐标轴上的变化率
2.方向导数：指定方向上的变化率
3.梯度的方向：方向导数最大的方向
4.梯度的模长：向量值
5.梯度下降：根据梯度的负方向使loss不断降低

二、pytorch中优化器——Optimizer

各种优化器都在optim包中，eg optim.SGD()
在这里插入图片描述
基本属性：defaults：优化器参数,（net.parameters(),学习率,momentum=0.9(动量，结合当前梯度与上一次更新信息，用于当前更新)控制记忆周期，通常设置为0.9这样会关注之前10次更新的数据）
普通梯度下降：

pytorch中更新公式为：
在这里插入图片描述

param_groups:管理的参数组（列表，元素为字典，最重要的一个元素为 key为params的元素）
state：参数的缓存,也是字典
_step_count:记录更新次数，学习率调整中使用

基本方法：zero_grad():清空所管理的参数的梯度（因为张量

最低0.47元/天解锁文章

博客等级

码龄8年

38
原创

9
点赞

23
收藏

5
粉丝

关注

私信

热门文章

分类专栏

软考
RPC 1篇
分布式 2篇
面试 10篇
并发 2篇
Spring框架 3篇
集合 1篇
IO流 1篇
Java基础 5篇
单点登录 1篇
设计模式 1篇
计算机网络 2篇

展开全部收起

上一篇：: （11）pytorch之损失函数

下一篇：: （13）pytorch之学习率调整

最新评论

RPC框架
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇关于RPC框架的博客非常有启发性。我认为下一篇博客可以继续探讨分布式系统中的通信机制，特别是针对RPC框架的实现细节进行深入分析。这样的技术文章对其他用户在构建高性能、可靠性分布式系统方面将会有很大的帮助。期待博主继续分享关于RPC框架的技术文章，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。