毕设过程中遇到的坑,开第一篇帖子来记录一下。
用MobaXterm连接上服务器,把代码和数据copy进去,run了一下train.py,报错如下:
一开始以为是用base环境下python3.10版本太高的原因,所以新开了一个python3.6的环境,再次测试,但还是报错,但报错信息不同了:
此时以为是代码的问题,调试了半天,结果是没有选择使用哪块gpu的原因。
查看当前服务器情况:
nvidia-smi
选择一块服务器运行自己的代码:
CUDA_VISIBLE_DEVICES=0 python train.py
数字代表GPU编号,运行时千万要看一眼当前GPU状态,选择空闲的去使用。
这样就可以跑起来啦!