一般连接服务器软件,在训练模型时,如果软件与服务器连接断开,则训练中断,有以下两个命令非常好用:
nohup python train.py 参数 & 这条命令很方便,比如你训练时在(python train.py 参数 )前面加nohup命令,后面加&就可以。默认将当前的输出打印在当前目录的nohup.out文件里,随时连接可以查看,也不怕断开连接训练不会继续
nohup python -u test.py > test.log 2>&1 &
- nohup 不挂起的意思
- python test.py python 运行test.py文件
- -u 代表程序不启用缓存,也就是把输出直接放到log中,没这个参数的话,log文件的生成会有延迟
test.log 将输出日志保存到这个log中,默认将当前的输出打印在当前目录的nohup.out文件里
- 2>1 2与>结合代表错误重定向,而1则代表错误重定向到一个文件1,而不代表标准输出;
- 2>&1 &与1结合就代表标准输出了,就变成错误重定向到标准输出.
- & 最后一个& ,代表该命令在后台执行
- 使用tail -f xx.log 可随时看log打印情况