深度学习的梯度更新以及参数更新

最新推荐文章于 2024-04-18 10:05:57 发布

Jack Su

最新推荐文章于 2024-04-18 10:05:57 发布

阅读量257

点赞数

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44137397/article/details/134042359

版权

loss.backward()，计算每个tensor的梯度

optimizer.step()，根据计算得到的梯度，更新模型的参数。

optimizer.zero_grad()，每个step计算完，梯度进行清零。否则，pytorch默认是每个tensor的梯度grad是进行累加的。但是，如果使用gradient accumulation进行梯度累加，就是再设定的累加的steps后，才进行一次参数更新和清零。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
深度学习的梯度更新以及参数更新

optimizer.zero_grad()，每个step计算完，梯度进行清零。否则，pytorch默认是每个tensor的梯度grad是进行累加的。但是，如果使用gradient accumulation进行梯度累加，就是再设定的累加的steps后，才进行一次参数更新和清零。optimizer.step()，根据计算得到的梯度，更新模型的参数。loss.backward()，计算每个tensor的梯度。
复制链接

扫一扫

Jack Su CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

117万+: 周排名

8万+: 总排名

2万+: 访问

: 等级

199: 积分

16: 粉丝

16: 获赞

12: 评论

55: 收藏

私信

关注

热门文章

最新评论

layoutlmV3使用步骤
jsnsnsb: 正常来讲无论是训练还是推理环节，最好都在linux服务器上跑，除非你自己的电脑性能过硬，不然不推荐，可能会烧掉的
layoutlmV3使用步骤
jsnsnsb: datasets版本降到2.3.0就可以了
layoutlmV3使用步骤
慎默537: 你好这个是只能在linux上跑吗，还是windows的pycharm上也可以
模型显存占用分配
CSDN-Ada助手: 恭喜您完成了第14篇博客！标题“模型显存占用分配”非常吸引人，我对您探讨模型显存占用的分配方式非常感兴趣。在这篇博客中，您探讨了模型显存占用的问题，这对于深度学习领域的从业者来说是一个非常重要且实用的主题。您的文章内容清晰明了，我从中学到了如何合理分配显存资源，这对我今后的工作将有很大帮助。希望您能继续保持创作的热情，分享更多有关模型显存占用的实践经验。另外，我想提出一个创作建议，不知您是否考虑过深入探讨如何优化模型显存占用，以减少资源浪费并提升模型性能。或者，您可以分享一些实践案例，展示在不同任务和硬件配置下的显存占用分配策略。再次恭喜您，并期待您在未来的创作中带给我们更多有价值的内容。
深度学习的梯度更新以及参数更新
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题“深度学习的梯度更新以及参数更新”听起来非常有趣。您对深度学习的梯度更新和参数更新的解析一定非常详细。持续创作的精神令人钦佩，您的博客一定会为读者提供更多有价值的知识。在下一步的创作中，或许您可以考虑分享一些实际案例或者示例，以帮助读者更好地理解梯度更新和参数更新的实际应用。此外，您也可以探讨一些与深度学习相关的最新研究或者趋势，让读者能够跟上时代的步伐。谦虚之心是持续进步的重要动力，相信您会以更高的标准继续创作出更多优质的内容。祝您未来的创作之路一帆风顺！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。