背景:
在服务器上使用conda安装pytorch环境,由于服务器上装的是cuda10.0,因此在安装pytorch的时候使用的是
conda install pytorch torchvision cudatoolkit=10.0
而不是使用默认的cudatoolkit=10.1
问题:
尽管选择安装的是10.1,但是跑程序的时候就出现了错误:
libcudart.so.10.1: cannot open shared object file: No such file or directory
输出torch.version.cuda显示的也是10.0.130,但是运行的时候却一直报缺少10.1的库
解决方法(参考https://blog.csdn.net/zqun817/article/details/88750321):
sudo ln -s /usr/local/cuda-10.0/lib64/libcudart.so.10.0 /usr/lib
sudo ln -s /usr/local/cuda-10.0/lib64/libcudart.so.10.0 /usr/lib/libcudart.so.10.1
sudo ldconfig
使用软连接,把错误提示中找不到的libcudart.so.10.1链接到libcudart.so.10.0
然后就ok了