最近在用pytorch做项目时,本人遇到RuntimeError: CUDA out of memory的错误,下面就此问题做一个记录和分享,并谈谈今后遇到爆显存问题的解决思路。
目录
3.当前项目代码是否还使用了keras/tensorflow
1.查看是否其他程序占用显存
遇到此类错误后,对于py格式的文件来说,程序会进行终止,也就是当前程序占用的显存将会被释放。此时可用 nvidia-smi 命令查看当前显存的使用情况。如果此时显存依然有比较大的占用,说明存在其他程序占用显存,使用kill命令结束不必要的程序即可。
2.查看pytorch和cuda是否匹配
使用方法torch.cuda.is_available(),确认pytorch和cuda是否匹配,如果返回False,需要调整一下cuda或torch的版本,重新部署一下环境。