pytorch配置深度学习GPU环境,以及报错解决方案

首先安装好Anaconda,使用临时清华源创建自己的环境

建议命令nvidia-smi后显示的cuda版本与Anconada的cudatoolkit版本一致或者接近,这样warning就没有了

 

官方文档的帮助

下载安装包,下载对应版本:

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/

我选择新的版本

这里电脑主机只需要有官方nvidia驱动就可以,不用再配置cuda、cudnn

conda install --offline pytorch-1.6.0-py3.7_cuda10.2.89_cudnn7.6.5_0.tar.bz2

 

sudo find /home -name libmkl_intel_lp64.so   查找缺失的文件,一般是缺少依赖项,将它加入到用户环境依赖项目即可,查找结果如下

/home/zhoudage/anaconda3/pkgs/mkl-2019.0-118/lib/libmkl_intel_lp64.so
/home/zhoudage/anaconda3/lib/libmkl_intel_lp64.so
 

配置用户环境变量:

 sudo vim(自己的编辑器即可) ./.bashrc

在最后面添加一行:

export LD_LIBRARY_PATH=/home/xxx/anaconda3/lib:$LD_LIBRARY_PATH

红色改为刚刚搜索到的路径

 

$ source ./.bashrc
$ echo $LD_LIBRARY_PATH

更新环境变量并显示

 

此时切换到conda的torch_gpu环境会显示OSError: libcurand.so.10: cannot open shared object file: No such file or directory

这是因为缺少anaconda环境下的cuda

anaconda就像一个虚拟机,我的真机环境的cuda驱动是11.1版本,但是刚才再conda环境中安装的torch对应的cuda是10.2版本,此时只需要再在conda下安装cuda10.2即可,这两个不冲突

conda install cudatoolkit=10.2   下载较慢,复制他的链接到迅雷

 

因为下载较慢,先用迅雷把这个文件下载好后离线安装

conda install --offline  cudatoolkit-10.2.89-hfd86e86_1.0.tar.bz2 

 

 

最后安装一下torch1.6.0

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  torch==1.6.0
 

圆满结束

 

检验gpu

torch.cuda.is_available()

程序员开车,警告一般忽略

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值