项目场景:
pytorch 在 预测阶段的 CUDA out of memory 问题
问题描述
-
使用 pytorch 时,训练阶段结束后,并保存模型,之后读入并预测新的大量数据, 会出现 CUDA out of memory 报错 ,哪怕 batch_size = 1。
-
除了老生常谈的 GPU 资源问题(内存确实过小,各个GPU不够平均), 解决办法参考:https://aitechtogether.com/ai-question/18910.html`
原因分析:
- 累计的梯度计算:梯度计算会占用大量的GPU空间,造成溢出
- number_workers过大
解决方案:
调用方法时,不使用梯度计算:
with torch.no_grad(): 具体方法名
例子:
适当调小torch.utils.data.DataLoader方法中的 number_workers参数即可