【ubuntu下,conda创建的虚拟环境在安装好torch后“import torch”时报错“OSError: libcudnn.so.8: cannot open shared object 】

ubuntu下,conda创建的虚拟环境在安装好torch后“import torch”时报错“OSError: libcudnn.so.8: cannot open shared object file: No such file or directory”


问题描述

ubuntu下,conda创建的虚拟环境在安装好torch后“import torch”时报错“OSError: libcudnn.so.8: cannot open shared object file: No such file or directory”

我安装的torch使用的命令是

conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia

然后进入python环境时,,import torch报错。


解决方案:

首先查看自己的cuda目录下是否有libcudnn.so.8这个文件,我的cuda目录是“/usr/local/cuda-11.7/targets/x86_64-linux/lib/”没有这个文件,所以可能是缺失cudnn相关的文件,可以把cudnn的lib和include中的文件复制到这个cuda对应的目录下,但是这台服务器的cuda环境不止我在用,还有其他人在使用,为了不影响服务器的整体环境,我将我需要的cudnn文件复制到我的虚拟环境中,具体步骤如下:
1)下载cudnn
https://developer.nvidia.com/rdp/cudnn-archive
我的cuda版本是11.7的,选择下面的这个版本,选择linux版本,这个版本是tar压缩包。
在这里插入图片描述
2)解压cudnn

tar -xf cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz

3)复制cudnn的lib和include中的文件至我的conda虚拟环境中

cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/lib/* /home/miniconda3/envs/env5_wf/lib/
cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/include/* /home/miniconda3/envs/env5_wf/include/

4)重新进入env5_wf虚拟环境,问题解决。

conda activate env5_wf
python
import torch

参考资料:
《Ubuntu20.04安装cuDNN8.0》https://blog.csdn.net/Netceor/article/details/125901836
《Ubuntu18及22安装NVIDIA驱动、CUDA、CUDNN、Pytorch》https://blog.csdn.net/caiqidong321/article/details/129600719?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_baidulandingword~default-1-129600719-blog-132103375.235v43control&spm=1001.2101.3001.4242.2&utm_relevant_index=4

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值