连服务器有时候会出现out of memory
解决方法:
换用空闲的gpu
1. 查看GPU
nvidia-smi -L
2. 查看7号GPU
nvidia-smi -q -i 7
如果只看memory情况。可以用:
nvidia-smi -q -i 7 -d MEMORY
3.设置GPUid
CUDA_VISIBLE_DEVICES=6(或CUDA_VISIBLE_DEVICES=6,7)command
举例说明:
版权归作者所有,任何形式转载请联系作者。
作者:宝图(来自豆瓣)
来源:https://www.douban.com/note/641416299/
这条命令适用于命令行运行tensorflow程序的时候,指定gpu.
只需要在命令之前设置环境变量,简单来说比如原本程序是命令行运行pythontrain.py
假定这里gpu总共有八块,通过nvidia-smi查看发现5,6,7是空闲的(从0开始编号)
则运行命令修改为:
CUDA_VISIBLE_DEVICES=5,6,7 python train.py