一开始没有使用tmux,所以在训练模型时,校园vpn由于长时间没有操作而断掉了,然后服务器就断掉了,训练过程就断掉了,停止在了45/60epoch。
后了解到tmux可以将进程直接挂在服务器后台,就不用担心网络以及vpn的变化会影响训练过程了。
1.安装
我是在我的虚拟环境中安装的tmux,所用使用的是conda安装语句
conda install tmux
2.新建tmux会话
tmux new -s <session-name>
例如
tmux new -s session1
可使用ctrl+d退出tmux会话
3.接入tmux会话
tmux attach -t <session-name>
推荐博文https://www.ruanyifeng.com/blog/2019/10/tmux.html
【写的非常全面】