之前以为model.eval()就可以停止计算梯度,但事实上model.eval()貌似只有禁用BatchNormalization和Dropout的功能。 在代码中加入torch.set_grad_enabled(False)后显存就够用了