一、检查显卡驱动
检查是否安装NVIDIA显卡
lspci | grep -i nvidia
查看显卡信息
nvidia-smi
出现上面所示,说明已经安装显卡驱动了
二、安装CUDA
1.查看g++版本
在终端输入
g++ -v
发现版本是g++9,Ubuntu20.4会默认该版本太高,无法安装CUDA,需要降低g++版本
sudo apt-get install gcc-7 g++-7
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 1
sudo update-alternatives --display gcc
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-7 9
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-9 1
sudo update-alternatives --display g++
为了方便终端命令的复制粘贴,在VSCode按快捷键Ctrl+J打开远程服务器终端,将上面的命令行粘贴,注意要先复制第一行试一下需不需要输入密码,否则就会出现如下错误
2.安装CUDA【在远程服务器上操作】
然后从官网下载对应版本的CUDA,除了GPU支持的最大CUDA版本之外,还要考虑Tensorflow对应的CUDA版本:
知道要安装的CUDA版本后,去NVIDIA官网直接下载对应版本:添加链接描述
下载runfile版本的,下载完成后在终端输入进行软件安装
sudo sh cuda_10.0.130_410.48_linux.run
按照提示与进行安装,有一个是问你是否要安装驱动的,因为之前查了NVIDIA驱动软件,已经有了,所以这一项选n,其他都选y或accept
3. 配置CUDA环境变量
安装好之后开始配置环境变量
在终端输入sudo vim ~/.bashrc
,在最后一行添加路径,记得把路径名改成你安装的对应版本的cuda文件名,我安装的是10.0版本,所以添加以下代码,按i
进入编辑模式
$ export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64\
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
按esc
退出编辑模式,再按:
进入命令行模式,输入wq
,保存并退出文件,回到终端模式
更新环境变量
source ~/.bashrc
检查cuda是否安装正确
cat /usr/local/cuda/version.txt
4.安装cudnn
进入官网下载对应版本压缩包
https://developer.nvidia.com/cudnn
下载完成后,解压安装包
tar -zxvf cudnn-10.0-linux-x64-v7.4.1.5.tgz
打开终端,进行文件拷贝,记得修改到你的cuda所在路径
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64
sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.0/lib64/libcudnn*
完成后查看cudnn版本,我安装的是7.4版本的,只有cudnn.h文件,所以用这个命令检查版本
cat /usr/local/cuda-10.0/include/cudnn.h | grep CUDNN_MAJOR -A 2
我看其他更高级的版本需要用下面这个命令来检查
cat /usr/local/cuda-11.0/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
成功下车!
参考博文: