最近深度学习项目,经常ssh远程链接服务器,模型一跑就是几十个小时,有时候需要查看状态。
不能因为意外断网,而中断模型的训练。这里介绍个简单的方法,不怕意外断网。
1.如下图,sudo ssh -l user 192.168.1.245 链接服务器
2.利用screen 命令 ,重起一个screen。这个就相当于远程服务器自己启动一个命令行接口。
screen -S david 这里稍微解释一下, david是你起的名字,用于后面查找这个screen,需要记牢!
发现服务器自己起了一个新的sreen
3. 这时候我们可以模拟一个任务,比如笔者写了一个python循环输出log,比较简单的。
如下图,执行它一下。
4.我们按下这个terminal的右上角的×,断开他。
5.启动一个新的terminal , 输入 ssh 重新链接远程服务器 sudo ssh -l user 192.168.1.245, 并输入命令
screen -ls 查看远程服务器存在的screen。
6.如下图,我们试试 30362是不是我们之前的 python 循环任务呢?
screen -r 30362
如下图,果然是我们之前的screen
7.至此我们重新接管了 之前的命令行窗口。不用担心中途意外情况了。
如下图,中断一下这个python循环程序。
8.对了,怎么断开当前的screen呢。用快捷键, 先按下 Ctrl + A, 再输入 K 键
如下图, 我们再次输入 screen -ls ,恩, 30362 没有了。