pytorch：反向传播前手动将梯度清零的原因

最新推荐文章于 2024-05-22 16:07:34 发布

开心邮递员

最新推荐文章于 2024-05-22 16:07:34 发布

阅读量1k

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42187536/article/details/123881735

版权

首先：清零代码：optmizer.zero_grad()

optimizer.zero_grad()             ## 梯度清零
preds = model(inputs)             ## inference
loss = criterion(preds, targets)  ## 求解loss
loss.backward()                   ## 反向传播求解梯度
optimizer.step()                  ## 更新权重参数

由于pytorch的动态计算图，使用loss.backward()和optimizer.step()进行梯度下降更新参数时，梯度并不会自动清零，而且两个操作是独立操作。其中。backward()反向传播求解梯度。step()更新权重参数。

说明pytorch每一步都是独立功能的操作，因此需要梯度清零。如果不进行optimizer.zero_grad()这一步操作，backward()时就会累加梯度。

因此pytorch将此步骤独立出来，可以更加灵活

开心邮递员

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pytorch：反向传播前手动将梯度清零的原因

首先：清零代码：optmizer.zero_grad()optimizer.zero_grad() ## 梯度清零preds = model(inputs) ## inferenceloss = criterion(preds, targets) ## 求解lossloss.backward() ## 反向传播求解梯度optimizer.step() ## 更新权重参数
复制链接

扫一扫

开心邮递员 CSDN认证博客专家 CSDN认证企业博客

码龄6年

65: 原创

31万+: 周排名

5万+: 总排名

10万+: 访问

: 等级

808: 积分

91: 粉丝

154: 获赞

4: 评论

427: 收藏

私信

关注

热门文章

最新评论

SQL-约束
ha_lydms: 这篇文章的主题非常实用，让我学到了很多新知识和技能。
SQL语言1
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
梯度反转层（Gradient reversal layer, GRL）
weixin_41672299: 你好，博主！我想请问一下你是否有尝试过将这个算法应用到源域和目标域一致的情况下呢，与不加DANN对比的结果如何呢？
梯度反转层（Gradient reversal layer, GRL）
谁知故人不识君: 就是原来的（没有GRL）的时候没有对抗关系，不满足生成器精度提高和域判别准确度越来越低这样的需求，所以需要引入GRL，这样每次梯度朝向成了特征层的分类精度是提高的，但是域判别的准确性确实下降的，满足分辨不清两个域的要求，形成对抗关系，这样的表述对吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。