报错:
RuntimeError: CUDA error: no kernel image is available for execution on the device
原因:
查资料是因为torch与cuda环境不匹配。
解决步骤:
1. 查看环境的CUDA版本。
很多查看cuda版本是用nvidia-smi,但是这是服务器的却不是环境的,我一直按照这个在安装torch,所以一直没成功,应该查看的命令是
nvcc --version
所以环境里的版本是11.0
2. get版本之后进入官方网站:
https://pytorch.org/get-started/previous-versions/
搜索对应CUDA版本的安装命令(cu110代表CUDA11.0),在终端中复制命令安装。
3. 卸载原来的torch
pip unstall torch
4. 复制官方网站语法安装
pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html
排坑
开始查的资料是:
1. 卸载 torch
pip uninstall torch
2. 安装torch
pip install torch #基本是装到了最新的torch
但是报错:
OSError: /home/aita/anaconda3/envs/FusionDTA/lib/python3.7/site-packages/nvidia/cublas/lib/libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not defined in file libcublasLt.so.11 with link time reference
查了资料还是版本不匹配,返回解决步骤。