在一个迭代循环中,optimizer.zero_grad()语句的位置比较随意,只要放在loss.backward()前面即可,它的作用是将梯度归零,否则会在每一个迭代中进行累加,loss.backward()的作用是反向传播,计算梯度,optimizer.step()的功能是优化器自动完成参数的更新.
optimizer.zero_grad()
loss.backward()
optimizer.step()
在一个迭代循环中,optimizer.zero_grad()语句的位置比较随意,只要放在loss.backward()前面即可,它的作用是将梯度归零,否则会在每一个迭代中进行累加,loss.backward()的作用是反向传播,计算梯度,optimizer.step()的功能是优化器自动完成参数的更新.
optimizer.zero_grad()
loss.backward()
optimizer.step()