二、Linux Nvidia+Cuda10.2+Cudnn10.2 安装步骤

一、安装Nvidia驱动 和 安装Cuda10.2

通过Cuda可同时安装nvidia和cuda驱动

0、安装前准备
0.1、查询显卡相关命令
1、Linux查看显卡信息:(ps:若找不到lspci命令,可以安装 yum install pciutils 或 yum install nvidia-detect)
lspci | grep -i vga
2、使用nvidia GPU可以:
lspci | grep -i nvidia
3、查看显卡驱动
cat /proc/driver/nvidia/version
0.2、安装依赖环境
0.2.1 检查内核版本和源码版本,保证一致

首先检测是否有gcc编译器

gcc --version

若没有,执行:

yum -y install gcc gcc-c++ kernel-devel  //安装gcc、c++编译器以及内核文件
ls /boot | grep vmlinu
rpm -aq | grep kernel-devel

也或者使用 uname -r 替换rpm -aq | grep kernel-devel
在这里插入图片描述

0.2.2 屏蔽系统自带的nouveau
查看命令:
lsmod | grep nouveau

修改dist-blacklist.conf文件:
vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:
#blacklist nvidiafb 

然后添加以下语句:
blacklist nouveau
options nouveau modeset=0

屏蔽前
在这里插入图片描述
一会重启屏蔽后,如下图,但是暂时先别重启
在这里插入图片描述

0.2.3 重建initramfs image步骤
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
0.2.4 重建initramfs image步骤
systemctl set-default multi-user.target
0.2.5 重新启动
reboot

输入如下命令,会发现nouveau没有加载,那就ok了

 lsmod | grep nouveau
0.2.6 进入文本模式

(进入文本模式后就会关闭X Server桌面服务程序,所以在安装过程中发现报X Server的错误,一般就是没有进入文本模式引起的)

init 3

注:安装完成后,可以使用init 5可重新进入图形界面。

1、下载Cuda

下载链接

2、安装Cuda
2.1、安装
sh cuda_10.2.89_440.33.01_linux.run
2.2、选择选项

等待文件运行出现界面后输入accept回车,然后只需要安装Driver、CUDA Tool,其他的可以通过回车进行取消,然后选择Install 回车,等待安装成功。
在这里插入图片描述

2.3、安装成功
===========
= Summary =
===========

Driver:   Installed
Toolkit:  Installed in /usr/local/cuda-10.2/
Samples:  Not Selected

Please make sure that
 -   PATH includes /usr/local/cuda-10.2/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-10.2/lib64, or, add /usr/local/cuda-10.2/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.2/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.2/doc/pdf for detailed information on setting up CUDA.
Logfile is /var/log/cuda-installer.log

2.4、安装成功测试
[root@bogon software]# nvidia-smi
Thu Aug 20 11:50:08 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01    Driver Version: 440.33.01    CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:04:00.0 Off |                  N/A |
| 10%   34C    P0    15W / 250W |      0MiB / 11019MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
2.5、nvcc 测试

这时候cuda是安装好了,但是环境变量找不到cuda程序,自己手动修改环境变量文件,通过vim或者gedit修改,对应命令分别为vim ~/.bashrcgedit ~/.bashrc,将下面的内容添加到文件最后,再通过source ~/.bashrc更新环境变量。

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

此时,输入nvcc -V检查安装是否成功,如下图则表示安装成功。

[root@bogon software]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89

三、安装Cudnn

1、下载Cudnn

下载链接
注意cudnn的下载,需要登录nvidia账号,所以通过服务器远程wget下载不可行,可通过下载在本地,然后上传到服务器。

下载后的文件名称为:

cudnn-10.2-linux-x64-v7.6.5.32.solitairetheme8
2、安装Cudnn
cp  cudnn-10.2-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.2-linux-x64-v7.6.5.32.tgz
tar -xvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/* /usr/local/cuda/include
sudo cp cuda/lib64/*   /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
3、测试Cudnn

查看cudnn版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

出现如下显示,即为成功

[root@bogon software]# cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 7
#define CUDNN_MINOR 6
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#include "driver_types.h"

四、安装常见问题

4.1、Nvidia 驱动安装
4.1.2 安装Nvidia驱动的时候出现,‘kernel version‘版本不一致,或者提示‘kernel source path’问题。

解决方式:添加--kernel-source-path路径:
在这里插入图片描述

五、参考

1、系统安装Nvidia显卡驱动 + cuda10.0 + cudnn + anaconda(python 3.6) + tensorflow2.0安装
2、Cuda和Cudnn版本对应关系
3、Cuda下载
4、conda search cuda后没有版本10的问题
5、Ubuntu安装Nvidia驱动和Cuda10.2

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值