首先安装好Anaconda,使用临时清华源创建自己的环境
建议命令nvidia-smi后显示的cuda版本与Anconada的cudatoolkit版本一致或者接近,这样warning就没有了
官方文档的帮助
下载安装包,下载对应版本:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
我选择新的版本
这里电脑主机只需要有官方nvidia驱动就可以,不用再配置cuda、cudnn
conda install --offline pytorch-1.6.0-py3.7_cuda10.2.89_cudnn7.6.5_0.tar.bz2
sudo find /home -name libmkl_intel_lp64.so 查找缺失的文件,一般是缺少依赖项,将它加入到用户环境依赖项目即可,查找结果如下
/home/zhoudage/anaconda3/pkgs/mkl-2019.0-118/lib/libmkl_intel_lp64.so
/home/zhoudage/anaconda3/lib/libmkl_intel_lp64.so
配置用户环境变量:
sudo vim(自己的编辑器即可) ./.bashrc
在最后面添加一行:
export LD_LIBRARY_PATH=/home/xxx/anaconda3/lib:$LD_LIBRARY_PATH
红色改为刚刚搜索到的路径
$ source ./.bashrc
$ echo $LD_LIBRARY_PATH
更新环境变量并显示
此时切换到conda的torch_gpu环境会显示OSError: libcurand.so.10: cannot open shared object file: No such file or directory
这是因为缺少anaconda环境下的cuda
anaconda就像一个虚拟机,我的真机环境的cuda驱动是11.1版本,但是刚才再conda环境中安装的torch对应的cuda是10.2版本,此时只需要再在conda下安装cuda10.2即可,这两个不冲突
conda install cudatoolkit=10.2 下载较慢,复制他的链接到迅雷
因为下载较慢,先用迅雷把这个文件下载好后离线安装
conda install --offline cudatoolkit-10.2.89-hfd86e86_1.0.tar.bz2
最后安装一下torch1.6.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch==1.6.0
圆满结束
检验gpu
torch.cuda.is_available()
程序员开车,警告一般忽略