问题复现:我们服务器是个集群,管理节点没有gpu,要到计算节点下进行gpu计算,首先我直接在gpu节点下直接screen -s建一个新的screen,这时候终端显示的是@gpu 显然好像是在计算节点下,可是这时我直接进行python导入tensorflow,神奇事情发生了。提示找不到cuda。。。但是我的环境是没有问题的。。一开始因为可能是师弟动过环境。。重新配置。。报错。。依然gg
最后忽然想到是不是当前并不在gpu下ssh gpu 。。。问题解决。。。所以一定切记虽然显示的是@gpu, 当在集群下新建screen 后最好在重新连接到节点下在进行科研。