torch yolov3梯度发散
原因:
每次计算之前zero_grad,梯度清0,如果没有这句
梯度会累加,产生一个很大的值,后面会梯度发散。
imgs = Variable(imgs.type(Tensor))
targets = Variable(targets.type(Tensor), requires_grad=False) optimizer.zero_grad() loss = model(imgs, targets) loss.backward() optimizer.step()