没有加with torch.no_grad()
with torch.no_grad()
对于推断非常有用,如果确定不会调用,它将减少计算的内存消耗,否则会有requires_grad=True。
在这种模式下,每次计算的结果都将具有requires_grad=False,即使输入具有requires_grad=True。
没有加with torch.no_grad()
with torch.no_grad()
对于推断非常有用,如果确定不会调用,它将减少计算的内存消耗,否则会有requires_grad=True。
在这种模式下,每次计算的结果都将具有requires_grad=False,即使输入具有requires_grad=True。