是这样的,我前几天通过mobaxterm连接实验室的服务器训练了C3D视频行为检测的模型,显卡是3080,有两张卡,我同时用两张卡跑了两个C3D模型,然后大概过了一个小时,跑完一个epoch后,接了一杯水回来,发现mobaxterm断开了服务器的连接,再想重连就连接不上了。当时以为可能实验室断电了导致IP号变了,便打开todesk远程控制准备远程连接这台服务器,然后todesk上提示“由于对方版本号太低,无法发起连接”,我想这可能服务器上装的todesk版本可能要升级一下了。三天后我到实验室,发现这台服务器主机亮着,还在运行着(貌似还在训练模型,有声音,摸主机的玻璃挺烫的)但是显示器连接不上,弹出“未找到输入信号,请检查视频线和视频源”但是我重新检查了线的接口,都是连接好的,没有问题,然后我问了一下师姐,师姐说可能是我跑的两个模型太大了,占用了服务器的所有资源导致显示器连接不上,建议我等模型训练完。
我大概是18号晚上开始的模型训练,21号下午时候去的实验室查看,现在又过去了一天半,还是连接不上
我现在就是担心这台服务器就一直这样在运行又连接不上显示器,怕损坏了服务器
有没有遇到过同样问题的朋友呀?你们是如何解决的呢?求助~~~