Ubuntu18.04下pytorch环境配置记录
-
禁用Secure boot
-
安装nvidia驱动
注意先添加软件下载源,清华或阿里云,否则apt install会失败;添加后可关闭软件自动更新等,防止内核自动升级,导致与显卡驱动不兼容。
软件源添加后查看:
安装:
可通过附加驱动或ubuntu-drivers devices #建议选择推荐的驱动 sudo apt install nvidia-driver-470
检验:
nvidia-smi
卸载重装:
sudo apt purge nvidia-* sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update sudo apt install nvidia-driver-470
-
安装Anaconda
安装:
卸载:
删除Anaconda文件夹,注释或删除.bashrc里的conda配置。随后重新安装。rm -rf anaconda文件夹名 sudo gedit ~/.bashrc source ~/.bashrc
-
安装cuda、cuDNN
cuda安装:
cuda包,下载按照官网教程;
continue–>accept–>不勾选driver并install;
配置环境变量:(版本号自行改)export PATH=/usr/local/cuda-10.2/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH export CUDA_HOME=/usr/local/cuda
检验:
nvcc -V
cuda卸载:
执行/usr/local/cuda10.2/bin/下的 ./cuda-uninstaller。cudnn安装:
cuDNN,注册后方能下载;
解压后,将cudnn的include/cudnn.h和lib/libcudnn*文件复制到cuda10.2的include/和lib64/中。
具体复制操作见原帖1
写完发现我是30系列的显卡,只适配cuda11以上的版本,重新装了一遍,切记看一下对应的关系。 -
安装pytorch-gpu
conda install pytorch=1.6 torchvision cudatoolkit=10.2 -c pytorch
CondaHTTPError问题:
conda换源
可以尝试将https–>http,亲测有效(但也尝试了几次才有效),用了北外
检验:
python import torch print(torch.cuda.is_available())
如果输出的结果为true,则表示pytorch build for GPU搭建成功。
重新装了对应cudatoolkit11.0以上的pytorch-gpu,根据pytorch官网的教程,cudatoolkit11.3一直安装不上,后来发现"install previous versions of PyTorch",安装了cudatoolkit11.0就好了。过往版本conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch
-
总结
1 主要参考了原帖1,具体细节都在里面。
2 踩的坑多了,记录也就多了…