【说在前面】
复杂的机器学习程序,特别是已经训练好跑的时候出的问题,不是说改CUDA就能改的。因为很多参数已经在另一个gpu里面了,单纯改一个test的代码是不够的。
如果是上述情况,只有查运行情况了,看看到底是什么程序占用了那么那么多的内存,可以的话kill掉就行。
报错如下

思路
简洁明了,他已经告诉你了,默认使用的那gpu内存不足。
在操作系统输入如下,查一下memory现在的状态:
nvidia-smi
害,发现GPU-0有一个进程正在执行导致1GB剩余都不够。
我们用GPU-1执行就行啦!

问题解决
python文件中:
import os
os.environ["CUDA_VISIBLE_DEVICES"] = '1'
解决了。
9347

被折叠的 条评论
为什么被折叠?



