1.RuntimeError: CUDA error: no kernel image is available for execution on the device
意思:cuda不能被正确运行
出现场景:使用同学的服务器跑毕设项目,刚开始训练时就报以上错误
解决情况:
linux查看服务器显卡
lshw -C display
出现结果一共两张显卡,分别为NVIDIA GK180GL(Tesla K40c)和Matrox G200eR2,程序调用了CUDA,它是NVIDIA专用的显卡驱动,即后者迈创显卡不能用CUDA,而查看该显卡的算力只有3.5,
pytorch 1.7以后要求跑神经网络的算力最低要求为5.0,因此要么把CUDA版本从现有的11.2降到9.0,且大概率降pytorch版本,这会带来代码的版本修改问题
要么,这里本人选择放弃内存12G的香喷喷服务器,改用本地的4G 5.0算力的搬砖机跑