注意:Ubuntu、显卡驱动、CUDA、CUDNN的版本一定要匹配
安装CUDA之前一定要先安装好显卡驱动,在安装CUDA时安装显卡驱动会导致CUDA安装失败
第一步:查看当前系统版本
ctrl+alt+t打开终端,输入以下命令:
lsb_release -a
第二步:查看已经安装的显卡驱动版本(默认已经安装了显卡驱动)
ctrl+alt+t打开终端,输入以下命令:
nvidia-smi
从上图中可以看出,当前设备独显驱动版本为:435.21
第三步:安装CUDA
1)根据前两步的查询结果安装对应版本的CUDA。独显驱动版本为:435.21,根据下表可以看出我们需要安装10.2.89以下版本的CUDA,这里我选择安装了10.1版本的CUDA。(此连接可查看除表格以外的其它帮助信息)
2)官方提供了多种安装方式,我选择第一种方式进行安装,即:runfile。点击此链接下载CUDA10.1版本的安装包
3)在CUDA安装包所在的文件夹下打开终端,执行如下命令进行安装:
chmod +x ./cuda_10.1.105_418.39_linux.run
sudo ./cuda_10.1.105_418.39_linux.run
由于我们之前已经将独显的驱动安装好了,所以这里不安装驱动,如下图所示:
等待安装完成,就可以进行下一步:配置环境变量。
如果我们不小心默认安装了所有选项,如下图所示:
稍等片刻后,可能会提示我们没有完成安装,详情请查看/var/log/cuda-installer.log文件。在此文件中我们可能会看到这样一句话“ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel”。出现这句的原因是我们的设备早已经安装了独显的驱动,这里再次安装就会提示该错误。我们不需要理会这个问题,直接进行配置环境这一步。
4)打开终端,输入以下命令打开bashrc文件,开始配置环境变量:
sudo gedit ~/.bashrc
在文件的最后面添加如下代码(具体路径根据CUDA实际的安装目录而定):
#added by cuda10.1 installer
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存文件并退出,然后在终端输入以下命令刷新环境变量:
source ~/.bashrc
5)在终端输入以下命令,如果显示下图中的结果,则说明CUDA安装成功
nvcc -V
第四步:安装CUDNN
1)根据CUDA的版本选择CUDNN的版本,点击此链接下载CUDNN。
2)下载完成后解压并进入该文件夹下,执行如下命令,进行相关文件的复制:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
3)打开终端,输入以下命令,查看CUDNN是否安装成功:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
依次输出7、6、5,即为CUDNN7.6.5版本。