注意:
(该方式只支持一个人使用,为了保证机器的运行稳定,也只推荐一个时间只有一个用户使用。大家可以在自己的机器上先把代码调试好,然后上传到服务器跑,使用之前在群里问一嘴有没有人在用)
咱们实验室的3090服务器还在订,估计等服务器到位,环境配置完还有一段时间。
实验室本来的服务器功率在满负载的时候会崩,所以实验室带1080的惠普老机器先可以让学弟学妹用来跑一些小的深度学习模型。
前些天姚老师问1007的王老师借了科研楼地下实机房的服务器,昨天去配了网关(这个机器网关一直会掉,只能跑去机房找到服务器然后用浏览器访问202.204.105.195这个网关然后输账号密码登陆),目前已经用conda配置了tensorflow-gpu==2.1的环境,也安装了jupyter notebook。
接下来讲一下楼下服务器的使用方法
1.从本机建立ssh连接
终端输入:
#ssh root@ip地址问我给
#密码我给
2.进入对应conda环境
#conda activate tf2py36
这里tensorflow的环境是2.1gpu版本,对应的cuda和cudnn都装好了,python保险起见用的3.6
3.开启jupyter notebook
使用如下代码开启jupyter notebook
jupyter notebook --allow-root
因为我们直接使用root用户登陆的,不是很安全,所以加上了–allow-root。咱们在使用的时候要注意,不要乱删,乱改配置,因为这台机器毕竟是借来的,给别人用坏了说不过去。
此时命令行会弹出提示jupyter notebook开启成功!
4.回到本地机器,再打开个终端,建立ssh通道
新建一个终端窗口输入如下命令:
#ssh 服务器用户名@服务器地址 -L127.0.0.1:1234:127.0.0.1:8888
ssh 通道建立成功!
5.使用本地浏览器访问服务器上的Jupyter notebook
在浏览器上输入网址 localhost:1234 即可连接到服务器上的jupyter notebook
在这里可能需要输入jupyter notebook的密码,密码找我要👌
最后进入熟悉的jupyter 界面,接下来的操作就和本地一样哈,前提是数据集要提前上传到服务器,推荐用xshell。
6.注销并退出
项目跑完后关闭所有kernel,然后点击Quit
Quit之后断开ssh连接就可以
7.最后统一一下
- 只支持一个人使用,用之前再群里提前问一嘴有没有人在用,不然把别人跑一半的项目顶了挺难受的。
- 只要连上咱们的校网,按照我的步骤一定可以连接上jupyter notebook,所以也不需要试,也是怕把别人项目顶了。
- 网关会掉,我昨晚5点去机房连上的,配置完放了一晚上,今早上九点已经掉了(提前ping 一下百度,看看校外网连的上不)。掉了之后不能连外面的网,所以配置新环境也不行,得提前找王老师借钥匙进去登网关
- 我们的数据集和jupyter项目统一放在 /root/文档 里面,省的后面太乱。(虽然我看了这个服务器里东西也没啥,但是毕竟还是人家的机器,不能太添乱🙂)
- 因为考虑到会有多个用户使用,所以没有准备让jupyter在后台常驻,所以在jupyter运行期间请保持ssh连接状态,不然ssh掉了会导致jupyter也结束