我的模型训练在服务器,发现ssh退出后,nvidia-smi占用为0了,这说明ssh退出后就终止训练,由于服务器有个超时自动退出机制,导致必须想办法解决这个问题,让我可以ssh退出后继续训练模型,最终发现如下方式可行
nohup ./train.sh &
注意用这个命令前必须保证程序是正常的
我的模型训练在服务器,发现ssh退出后,nvidia-smi占用为0了,这说明ssh退出后就终止训练,由于服务器有个超时自动退出机制,导致必须想办法解决这个问题,让我可以ssh退出后继续训练模型,最终发现如下方式可行
nohup ./train.sh &
注意用这个命令前必须保证程序是正常的