[PyTorch]一个非常好的抢救outofmemory的方法

最新推荐文章于 2023-12-26 09:13:49 发布

c2a2o2

最新推荐文章于 2023-12-26 09:13:49 发布

阅读量3.3k

点赞数 1

分类专栏：机器学习 pytorch

机器学习同时被 2 个专栏收录

215 篇文章 17 订阅

订阅专栏

pytorch

20 篇文章 3 订阅

订阅专栏

torch.backends.cudnn.benchmark = True 在程序刚开始加这条语句可以提升一点训练速度，没什么额外开销。我一般都会加
2. 有时候可能是因为每次迭代都会引入点临时变量，会导致训练速度越来越慢，基本呈线性增长。开发人员还不清楚原因，但如果周期性的使用torch.cuda.empty_cache()的话就可以解决这个问题。这个命令是清除没用的临时变量的。
3. 使用Variable的数据时候要非常小心。不是必要的话尽量使用Tensor来进行计算
---------------------
作者：feitianlzk
来源：CSDN
原文：https://blog.csdn.net/feitianlzk/article/details/80387109
版权声明：本文为博主原创文章，转载请附上博文链接！

Pytorch 训练时有时候会因为加载的东西过多而爆显存，有些时候这种情况还可以使用cuda的清理技术进行修整，当然如果模型实在太大，那也没办法。

使用torch.cuda.empty_cache()删除一些不需要的变量代码示例如下：

try:
output = model(input)
except RuntimeError as exception:
if "out of memory" in str(exception):
print("WARNING: out of memory")
if hasattr(torch.cuda, 'empty_cache'):
torch.cuda.empty_cache()
else:
raise exception
测试的时候爆显存有可能是忘记设置no_grad, 示例代码如下：

with torch.no_grad():
for ii,(inputs,filelist) in tqdm(enumerate(test_loader), desc='predict'):
if opt.use_gpu:
inputs = inputs.cuda()
if len(inputs.shape) < 4:
inputs = inputs.unsqueeze(1)

else:
if len(inputs.shape) < 4:
inputs = torch.transpose(inputs, 1, 2)
inputs = inputs.unsqueeze(1)
---------------------
作者：xiaoxifei
来源：CSDN
原文：https://blog.csdn.net/xiaoxifei/article/details/84377204
版权声明：本文为博主原创文章，转载请附上博文链接！