pytorch:反向传播前手动将梯度清零的原因

首先:清零代码:optmizer.zero_grad()

optimizer.zero_grad()             ## 梯度清零
preds = model(inputs)             ## inference
loss = criterion(preds, targets)  ## 求解loss
loss.backward()                   ## 反向传播求解梯度
optimizer.step()                  ## 更新权重参数

由于pytorch的动态计算图,使用loss.backward()和optimizer.step()进行梯度下降更新参数时,梯度并不会自动清零,而且两个操作是独立操作。其中。backward()反向传播求解梯度。step()更新权重参数。

说明pytorch每一步都是独立功能的操作,因此需要梯度清零。如果不进行optimizer.zero_grad()这一步操作,backward()时就会累加梯度。

因此pytorch将此步骤独立出来,可以更加灵活

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值