安装环境:ubuntu20.04.2LTS
该文章仅为本人学习过程中的笔记,仅供学习使用
若有问题请大家多多指教
说明
首先看了很多网上的教程都说需要禁用NVIDIA Nouveau驱动但是经过多次尝试我的20.04.0LTS系统都不能禁用成功,所以就直接安装了,实践发现不禁用也能成功。
我的教程仅供参考,大家自己自己情况看,若能禁用成功最好还是禁用下把。下面搬运禁用的方法。
安装N卡驱动
- 禁用NVIDIA Nouveau驱动
- ctrl+alt+t 打开终端输入:
ubuntu-drivers devices
显示如下,倒数第二行nvidia-driver-460 - distro non-free后面有recommended字样说明 nvidia-driver-460是推荐的版本:
mianma@mianma:~$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001C8Csv00001558sd0000850Abc03sc02i00
vendor : NVIDIA Corporation
model : GP107M [GeForce GTX 1050 Ti Mobile]
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-450 - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-460-server - distro non-free
driver : nvidia-driver-460 - distro non-free recommended
driver : xserver-xorg-video-nouveau - distro free builtin
下面进行安装,两种方法二选一
方法一
输入命令直接安装推荐版本:
sudo ubuntu-drivers autoinstall
方法二
输入命令安装指定版本:
sudo apt install nvidia-driver-460
安装后需要重启电脑
打开终端输入:
nvidia-smi
显示如下:
mianma@mianma:~$ nvidia-smi
Sun Mar 28 14:47:33 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39 Driver Version: 460.39 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GTX 105... Off | 00000000:01:00.0 Off | N/A |
| N/A 47C P0 N/A / N/A | 313MiB / 4040MiB | 5% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1030 G /usr/lib/xorg/Xorg 80MiB |
| 0 N/A N/A 1607 G /usr/lib/xorg/Xorg 134MiB |
| 0 N/A N/A 1785 G /usr/bin/gnome-shell 35MiB |
| 0 N/A N/A 3364 G ...AAAAAAAAA= --shared-files 52MiB |
+-----------------------------------------------------------------------------+
可以看到右上方显示CUDA Version: 11.2说明该驱动支持的最高CUDA版本是11.2
然后在终端输入:
nvidia-settings
出现图形界面设置界面说明N卡驱动安装成功。
安装CUDA
下载CUDA(安装方式有好几种这里只介绍笔者使用的方法)
笔者这里下载的是11.2版本
选择Linux—x86_64—Ubuntu—20.04—runfile(local)
终端输入:
wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda_11.2.2_460.32.03_linux.run
下载完成后输入:
sudo sh cuda_11.2.2_460.32.03_linux.run
注意该命令只适用于下载CUDA11.2版本runfile下载方式
进入安装界面(里面的x表示execute选中的意思)
CUDA Install
-[ ] Driver
[ ] 440.33.01
+[ x] CUDA Toolkit 11.2
[ x] CUDA Samples 11.2
[ x] CUDA Demo Suite 11.2
[ x] CUDA Documentation 11.2
Options
Install
因为刚才安装过显卡驱动,所以除了第一个不安装其他都勾选安装(如上面的代码所示)
切记!!!安装结束后需要配置环境变量。否这会找不到相关路径。
打开.bashrc文件
vi ~/.bashrc
在末尾加上(I键进行编辑,esc退出编辑,:wq保存并退出)
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
export PATH=$PATH:/usr/local/cuda-11.1/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.1
注意这三条语句里的cuda-11.1需要根据你的cuda所在位置和文件名进行更改的
终端输入
nvcc -V
显示如下代码则说明CUDA安装成功
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Tue_Sep_15_19:10:02_PDT_2020
Cuda compilation tools, release 11.1, V11.1.74
Build cuda_11.1.TC455_06.29069683_0
解决无法解析DNS
这里可能会出现无法解析DNS的情况
解决方法:终端输入(输入时一定要加sudo否则可能会没有权限修改)
sudo vim /etc/resolv.conf
打开以后按I键进入编辑模式,在最后加上
nameserver 8.8.8.8
编辑完成按esc退出编辑模式,然后输入:wq
:wq
继续下载就能解决DNS问题
解决找不到vim指令
找不到vim指令是应为没有下载vim造成的
下载vim:
sudo apt install vim
检测是否安装成功,终端输入
vim a.txt
出现vim界面则说明安装成功
安装cuDNN
cudnn就是一个神经网络加速包,也谈不上安装,把包复制进去就好了。
进入cuDNN下载,匹配对应的CUDA下载对应版本,选择cuDNN Library for Linux下载;下载后需要解压。
安装
sudo cp cuda/include/cudnn* /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn*
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
需要注意的是前后两个路径一定要写对前者对应的是下载的cuDNN包里面的东西,后者则是CUDA路径里的位置。
到这里就安装成功了。
安装PyTorch
进入PyTorch下载
若无pip应先安装pip
sudo apt-get install pip3
再进行下载
pip install torch==1.8.1+cu111 torchvision==0.9.1+cu111 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
若不能成功可一直执行该pip指令直至成功为止,也可以设置其他pip源
完成后终端输入
python3
进入python命令行后,执行以下命令。如果不报错就说明安装成功了。
import torch
x = torch.rand(5, 3)
print(x)
成功输出形式应如此
tensor([[0.2067, 0.9889, 0.9131],
[0.1603, 0.0091, 0.8403],
[0.7249, 0.3191, 0.2547],
[0.3795, 0.4371, 0.7935],
[0.0254, 0.0016, 0.0493]])
此外,要检查您的GPU驱动程序和CUDA是否已启用并可由PyTorch访问,请运行以下命令返回CUDA驱动程序是否已启用:
import torch
torch.cuda.is_available()
返回值应为True
到此安装成功