ubuntu18.4 3090 显卡驱动,cuda,cudnn 记录

安装ubuntu18.04系统,

本教程目录,

1安装显卡驱动

2安装cuda驱动

3 复制cudnn库到cuda安装目录的指定位置

4卸载显卡驱动

5卸载cuda驱动

一般做法是先安装显卡驱动,那么在cuda安装的时候就不要再安装显卡驱动了,再安装cudnn ,

一   显卡驱动安装

①使用第三方驱动

先把默认显卡驱动删除掉
sudo apt-get purge nvidia*
添加显卡驱动第三方ppa源
sudo add-apt-repository ppa:graphics-drivers/ppa
更新软件列表(不是更新软件)
sudo apt-get update
查找适合的驱动版本
ubuntu-drivers devices
结果
yu@yulinux:~/下载$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00002484sv000010B0sd0000146Bbc03sc00i00
vendor   : NVIDIA Corporation
driver   : nvidia-driver-455 - third-party free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin
安装推荐的显卡驱动
sudo apt-get install nvidia-driver-455
安装后重启机器
reboot
重启后查看显卡是否生效
nvidia-smi
Mon Aug  2 11:02:45 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.67       Driver Version: 460.67       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 3090    Off  | 00000000:01:00.0 Off |                  N/A |
| 81%   63C    P2   133W / 350W |  22287MiB / 24265MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1411      C   python                          22283MiB |
+-----------------------------------------------------------------------------+

②去nvidia官网搜索linux64位下载,显卡驱动460支持cuda11.2,470支持cuda11.4

找到显卡驱动文件,更改执行权限
sudo chmod a+x ./NVIDIA-Linux-x86_64-460.67.run
执行安装
sudo ./NVIDIA-Linux-x86_64-460.67.run
安装过程
 提示 pre-install script failed ,选择继续安装
 提示 dkms 选择yes
 提示 32位兼容库,选yes
 提示 X-org,选no
然后就安装好了
nvidia-smi命令显示显卡信息即可

二安装cuda驱动

安装cuda可以在字符界面下安装

Ubuntu字符界面与图形界面切换

在登陆系统页面输入密码前,使用快捷键

 图形界面切换字符界面快捷键Ctrl+Alt+F6

 字符界面切换图形界面快捷键Ctrl+Alt+F7

先在系统安装依赖库

​
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

​

安装cuda

首先是版本的选择,怎么选择,要根据pytorch和tensorflow-gpu版本支持的cuda版本来选择, 百度搜索cuda下载,去英伟达官网下载

30系显卡不支持低版本,我这里选择pytorch1.7支持的版本是9.2-11.0,这里选11.0的版本,

下载建议

 把wget后面的地址复制下来,通过浏览器地址栏输入
http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run
就可以通过浏览器下载了,这样下载会快很多
下载完成后,找到对应的目录
修改权限sudo chmod a+x  cuda_11.0.2.450.51.05_linux.run
运行 sudo sh cuda_11.0.2.450.51.05_linux.run --no-opengl-libs

安装过程

提示需要输入accept,下一步出现安装选项,需要去掉Driver选项,继续选择install,安装完成会提示Driver 没被选择,且需要把安装路径写入环境变量

添加环境变量

vim ~/.bashrc

在文件末尾添加两行

export PATH="/usr/local/cuda-11.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH"

保存后执行更新

source ~/.bash

检查是否成功

nvcc -V 或者nvcc --version
后面是大写的V
yu@yulinux:~$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Thu_Jun_11_22:26:38_PDT_2020
Cuda compilation tools, release 11.0, V11.0.194
Build cuda_11.0_bu.TC445_37.28540450_0

三  cudnn安装

cudnn只是一个库文件,不需要安装,只需要解压后把文件复制到对应的cuda的include文件夹和lib64文件夹中即可。

同样去英伟达官网下载,需要注册账号的,

选择第一个cudnn library for linux[x86_64]  点击就会下载

下载完成后,参照官方文档安装即可

Before issuing the following commands, you'll need to replace x.x and v8.x.x.x with your specific CUDA version and cuDNN version and package date.

Procedure

  1. Navigate to your <cudnnpath> directory containing the cuDNN Tar file. 进入到cudnn压缩包的目录,
  2. Unzip the cuDNN package.
    $ tar -xzvf cudnn-x.x-linux-x64-v8.x.x.x.tgz  解压

    or

    $ tar -xzvf cudnn-x.x-linux-aarch64sbsa-v8.x.x.x.tgz  
  3. Copy the following files into the CUDA Toolkit directory, and change the file permissions.
    $ sudo cp cuda/include/cudnn*.h /usr/local/cuda/include  把头文件复制到include目录
    $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64    把库文件复制到lib64目录
    $ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*   修改所有复制后的头文件和库文件的权限
    

检查是否安装成功

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
结果
yu@yulinux:~$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 0
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#endif /* CUDNN_VERSION_H */

四 卸载显卡驱动

ubuntu18.04有时候掉驱动,cuda不可用,使用ubuntu-drivers devices推荐的驱动时,不能选择服务器版本的驱动,否则cuda安装不成功 

掉驱动的情况出现时,显卡驱动本身并没有被卸载,重装驱动则需要把原来的驱动完全删除

这时要先卸载驱动,先查看调用驱动的进程 X 表示图形界面服务

ps aux | grep X

如果显示有桌面服务,就要先关闭图形界面

#以下是ubuntu18.04默认gnome桌面的关闭方式,不同系统版本可能不同
#关闭用户图形界面
sudo systemctl set-default multi-user.target
sudo reboot
#开启用户图形界面
sudo systemctl set-default graphical.target
sudo reboot

关闭图形界面后,再查看显卡进程,会发现X图形进程停止了

然后卸载存在的驱动(这是卸载安装的包)

sudo apt-get --purge remove nvidia-*

对于使用run文件安装的显卡驱动,直接执行下面命令卸载

有原显卡驱动文件时
./NVIDIA-Linux-x86_64-460.67.run --uninstall #确保卸载干净。
无原显卡驱动文件时
sudo /usr/bin/nvidia-uninstall

五 卸载cuda驱动

如果有原cuda驱动安装文件,执行
sudo sh cuda_11.0.2.450.51.05_linux.run --uninstall

如果没有原cuda驱动安装文件
sudo /usr/local/cuda-11.0/bin/cuda-uninstaller 

然后到/usr/local/ 目录下,把cuda相关的文件全删除
sudo rm -rf cuda*

六 卸载cudnn

cudnn只是库文件,当删除掉/usr/local/下的所有cuda文件夹时,自然就删除了

然后执行一二三步,重新安装即可

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值