Ubuntu20.04 + CUDA11.6+Pytorch(GPU版)
1. NVIDIA驱动安装
https://blog.csdn.net/qq_40907977/article/details/115305634
比较详细的nvidia驱动安装的教程,根据个人电脑不同应自己调整
1.1删除原有驱动
sudo apt-get purge nvidia*
sudo apt-get autoremove
1.2 安装依赖
sudo apt-get install build-essential gcc-multilib dkms
1.3 禁用nouveau驱动
使用Vim编辑器,没有请按照提示安装
编辑/etc/modprobe.d/blacklist-nouveau.conf 文件,添加一下内容
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
关闭nouveau
$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
1.4 重启
reboot
1.5 获取内核源代码
$ apt-get install linux-source
$ apt-get install linux-headers-x.x.x-x-generic
在这里我安装的是linux-headers-4.15.0-101-generic
1.6 安装nvidia驱动
此时由于显卡没有安装驱动,图形化界面会出现问题,但是并不影响操作
sudo chmod NVIDIA*.run
从nvidia官网找到自己的显卡驱动并下载该驱 https://www.nvidia.cn/Download/index.aspx?lang=cn
在下载文件下打开terminal输入以下命令进行安装
sudo ./NVIDIA-Linux-x86_64-384.59.run –no-x-check -no-nouveau-check -no-opengl-files(下载文件名)
安装完成后对驱动进行挂载
modprobe nvidia
驱动的安装过程一定要看链接给出的图文进行选择,否则可能会出现问题,安装完成后重启,重启后图形界面就会恢复
1.7 检验安装是否成功
nvidia-smi
若显示如下信息说明安装成功
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eoqyaHZd-1652090712132)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 16-27-03.png)]
Anacond安装
CUDA11.6安装
本人选择的是CUDA11.6 直接在网页上选择network安装[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-12PQoMjh-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/截屏2022-05-09 18.07.02.png)]
直接输入命令行
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/3bf863cc.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
sudo apt-get update
sudo apt-get -y install cuda
注意:一般使用network安装的,大部分都是最新版本,若下载比较老的版本请使用runfile(local)
配置环境变量,输入sudo vim ~/.bashrc
在文件末尾添加
# CUDA Soft Link
export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
刷新环境变量source ~/.bashrc
输入mvcc -V
查看CUDA的版本
cuDNN的安装
按照官方网站的cuDNN安装指南进行的安装,安装的版本文deb版本
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sgIX11pO-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/截屏2022-05-09 18.31.52.png)]
进入Installation Guide
本人使用的是Ubuntu Network Installation输入指令
wget https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/cuda-${OS}.pin
sudo mv cuda-${OS}.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/7fa2af80.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/ /"
sudo apt-get update
输入如下指令
sudo apt-get install libcudnn8=${cudnn_version}-1+${cuda_version}
sudo apt-get install libcudnn8-dev=${cudnn_version}-1+${cuda_version}
其中
Where:
- ${cudnn_version} is 8.4.0.*
- ${cuda_version} is cuda10.2 or cuda11.6
然后进行测试
$cp -r /usr/src/cudnn_samples_v8/ $HOME
$ cd $HOME/cudnn_samples_v8/mnistCUDNN
$make clean && make
$ ./mnistCUDNN
第一次测试失败,失败原因:
mnistCUDNN sudo make
CUDA_VERSION is 11010
Linking agains cublasLt = true
CUDA VERSION: 11010
TARGET ARCH: x86_64
HOST_ARCH: x86_64
TARGET OS: linux
SMS: 35 50 53 60 61 62 70 72 75 80 86
test.c:1:10: fatal error: FreeImage.h: No such file or directory
1 | #include "FreeImage.h"
| ^~~~~~~~~~~~~
compilation terminated.
此时执行
sudo apt-get install libfreeimage3 libfreeimage-dev
运行
./mnistCUDNN
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3KePBPOl-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 20-20-53.png)]
安装Pytorch
个人建议不要使用anacond自带的导航进行安装,因为会安装比较旧的版本,会出现与CUDA版本不符的情况
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fmjOVt7x-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 18-16-46.png)]
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
安装时要更cu113成为cu116即可安装成功