Linux Nvidia+Cuda10.2+Cudnn10.2 安装步骤
一、安装Nvidia驱动 和 安装Cuda10.2
通过Cuda可同时安装nvidia和cuda驱动
0、安装前准备
0.1、查询显卡相关命令
1、Linux查看显卡信息:(ps:若找不到lspci命令,可以安装 yum install pciutils 或 yum install nvidia-detect)
lspci | grep -i vga
2、使用nvidia GPU可以:
lspci | grep -i nvidia
3、查看显卡驱动
cat /proc/driver/nvidia/version
0.2、安装依赖环境
0.2.1 检查内核版本和源码版本,保证一致
首先检测是否有gcc编译器
gcc --version
若没有,执行:
yum -y install gcc gcc-c++ kernel-devel //安装gcc、c++编译器以及内核文件
ls /boot | grep vmlinu
rpm -aq | grep kernel-devel
也或者使用 uname -r
替换rpm -aq | grep kernel-devel
0.2.2 屏蔽系统自带的nouveau
查看命令:
lsmod | grep nouveau
修改dist-blacklist.conf文件:
vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb
然后添加以下语句:
blacklist nouveau
options nouveau modeset=0
屏蔽前
一会重启屏蔽后,如下图,但是暂时先别重启
0.2.3 重建initramfs image步骤
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
0.2.4 重建initramfs image步骤
systemctl set-default multi-user.target
0.2.5 重新启动
reboot
输入如下命令,会发现nouveau没有加载,那就ok了
lsmod | grep nouveau
0.2.6 进入文本模式
(进入文本模式后就会关闭X Server桌面服务程序,所以在安装过程中发现报X Server的错误,一般就是没有进入文本模式引起的)
init 3
注:安装完成后,可以使用init 5可重新进入图形界面。
1、下载Cuda
2、安装Cuda
2.1、安装
sh cuda_10.2.89_440.33.01_linux.run
2.2、选择选项
等待文件运行出现界面后输入accept回车,然后只需要安装Driver、CUDA Tool,其他的可以通过回车进行取消,然后选择Install 回车,等待安装成功。
2.3、安装成功
===========
= Summary =
===========
Driver: Installed
Toolkit: Installed in /usr/local/cuda-10.2/
Samples: Not Selected
Please make sure that
- PATH includes /usr/local/cuda-10.2/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-10.2/lib64, or, add /usr/local/cuda-10.2/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.2/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.2/doc/pdf for detailed information on setting up CUDA.
Logfile is /var/log/cuda-installer.log
2.4、安装成功测试
[root@bogon software]# nvidia-smi
Thu Aug 20 11:50:08 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce RTX 208... Off | 00000000:04:00.0 Off | N/A |
| 10% 34C P0 15W / 250W | 0MiB / 11019MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
2.5、nvcc 测试
这时候cuda是安装好了,但是环境变量找不到cuda程序,自己手动修改环境变量文件,通过vim或者gedit修改,对应命令分别为vim ~/.bashrc
和gedit ~/.bashrc
,将下面的内容添加到文件最后,再通过source ~/.bashrc
更新环境变量。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
此时,输入nvcc -V
检查安装是否成功,如下图则表示安装成功。
[root@bogon software]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89
三、安装Cudnn
1、下载Cudnn
下载链接
注意cudnn的下载,需要登录nvidia账号,所以通过服务器远程wget下载不可行,可通过下载在本地,然后上传到服务器。
下载后的文件名称为:
cudnn-10.2-linux-x64-v7.6.5.32.solitairetheme8
2、安装Cudnn
cp cudnn-10.2-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.2-linux-x64-v7.6.5.32.tgz
tar -xvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/* /usr/local/cuda/include
sudo cp cuda/lib64/* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
3、测试Cudnn
查看cudnn版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
出现如下显示,即为成功
[root@bogon software]# cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 7
#define CUDNN_MINOR 6
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
#include "driver_types.h"
四、安装常见问题
4.1、Nvidia 驱动安装
4.1.2 安装Nvidia驱动的时候出现,‘kernel version‘版本不一致,或者提示‘kernel source path’问题。
解决方式:添加--kernel-source-path
路径:
五、参考
1、系统安装Nvidia显卡驱动 + cuda10.0 + cudnn + anaconda(python 3.6) + tensorflow2.0安装
2、Cuda和Cudnn版本对应关系
3、Cuda下载
4、conda search cuda后没有版本10的问题
5、Ubuntu安装Nvidia驱动和Cuda10.2