主要有两种方法
· 在终端运行训练程序的时候,前面加上指定语句,比如
CUDA_VISIBLE_DEVICES=2 python train.py
· 在训练程序的最前面加上:
这种方法有时候不管用,可能是因为项目代码在某些地方已经设定了GPU的环境变量
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "2"
数字2指的是GPU的代号,只需在终端输入下面命令就能看(每隔0.1s就刷新一次)
watch -n 0.1 nvidia-smi
看服务器的cuda版本
终端输入命令
cat /usr/local/cuda/version.txt
程序后台运行:
运行之后终端将不会输出东西,但是那些原本终端的输出会保存在与train.py同个文件夹的nohup.out文件中,VScode能够打开看。同时终端会输出进程的PID。
nohup python train.py &
停下后台运行的程序:
12345是程序进程的PID
kill -9 12345
如果kill了