1. 背景
最近使用Xshell连接远程服务器进行人脸识别算法的训练,但是当Xshell由于一段时间没有操作,就会与服务器失去通信,Xshell便会自动中断进程,这个时候训练进程便自动停止了。经过去网上寻找方法,找到使用nohup + 运行指令 + &的方法将进程放到终端,可以保证通信中断继续训练,接下来是个案例。
2. 小测试
2.1 我首先看下当前GPU上的训练进程,执行:
nvidia-smi
显示:
2.2 执行将进程放入后台的指令:
nohup python train.py -net mobilefacenet -b 16 -w 3 &
再看下GPU进程,执行:
nvidia-smi
发现后台多了一个23082的进程。
2.3 关闭服务器,再重新等陆,再使用nvidia-smi看一下
发现23082的后台进程仍然再运行,只要不执行 kill -9 23082,它都会存在。
结束。。。