Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch

Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch

1. 首先了解自己服务器的操作系统内核版本等信息:

(1)查看操作系统的版本信息:cat /etc/issue或 cat /etc/lsb-release
在这里插入图片描述
(2)查看服务器显卡信息:
A. lspci | grep -i nvidia查看全部显卡信息
在这里插入图片描述
B. nvidia-smi 查看已经安装了对应的显卡驱动
在这里插入图片描述
C. cat /proc/driver/nvidia/version查看安装的显卡的驱动信息。
在这里插入图片描述
显卡驱动的安装需要根据操作系统的版本进行选择。

2. 驱动安装

(1) 安装驱动前必须先安装gcc
由于ubuntu22默认安装的是gcc版本是11.x, 在驱动安装过程中会出现不匹配问题,需要将gcc版本指定为9。
在这里插入图片描述

sudo apt -y install gcc-9 g++-9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 9
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-9 9

后边两行用于将刚安装的gcc和g++类似于注册的操作加入到bin中,用于可选择操作。也就是说通过这个操作不断向系统注册新的gcc和g++版本。

/usr/local/cuda-11.1/bin/gcc -> /usr/bin/gcc-9  
/usr/local/cuda-11.1/bin/ar -> /usr/bin/gcc-ar-9  
/usr/local/cuda-11.1/bin/ranlib -> /usr/bin/gcc-ranlib-9 
/usr/local/cuda-11.1/bin/nm -> /usr/bin/gcc-nm-9

更新链接配置
sudo ln -s /usr/bin/gcc-9 /usr/local/cuda-11.1/bin/gcc
添加到PATH

export PATH=/usr/local/gcc/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/gcc/lib64
export MANPATH=/usr/local/gcc/share/man:$MANPATH

gcc --versiongcc -v查看安装的版本号

(2) Nvidia驱动安装
Note: 旧版本的显卡驱动完全卸载
sudo sh NVIDIA-Linux-x86_64-xxx.xx.xx.run -- uninstall

sudo /usr/bin/nvidia-uninstall
此外,安装之前,需要先禁用。
sudo vim /etc/modprobe.d/blacklist.conf
在文件的最后面加入以下的内容:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

检查操作是否成功:lsmod | grep nouveau没显示即成功。
更新initramfs,需要稍微等一会
sudo update-initramfs -u
重启系统。
验证屏蔽是否成功,执行下面语句,结果为空,即为成功。
lsmod | grep nouveau
Nvidia驱动下载
在这里插入图片描述
由于Linux系统是Ubuntu22, 因此cuda Toolkit选择11.2。
将下载好的显卡驱动上传到服务器进行安装。
在这里插入图片描述

chmod +x NVIDIA-Linux-x86_64-460.106.00.run
sudo bash ./NVIDIA-Linux-x86_64-460.106.00.run

采用上述命令进行驱动的安装。安装完成之后,可以采用以下命令进行检查:
nvidia-smi
在这里插入图片描述
(3)下载对应版本的cuda, 选择cuda v11.1.0。
在这里插入图片描述
下载cuda .run文件并进行安装

wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
安装过程中的选择项:

nvidia accelerated graphics driver ,n 。重复安装会报错
其他的都选yes。
软连接的建立。注意还有一个选项是软连接的建立,会在/usr/local/下面建立一个软连接cuda该软连接连接到安装的真正的cuda-11.1的地址。软连接的建立可以用于多个版本的cuda的管理。
在这里插入图片描述
修改软连接就可以修改cuda的版本。
在这里插入图片描述
sudo vim ~/.bashrc加入以下的内容:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

使用nvcc -V对cuda的安装进行检查。
在这里插入图片描述

多版本的CUDA管理。

删除旧的软连接再建立新的软连接的方式来实现不同版本的cuda的切换。

sudo rm -rf cuda # 删除旧版本的软连接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda  # 建立新版本的软连接,前面的路径是需要的版本的cuda的安装路径。

(4) 安装对应的cudnnv8.2.1。
在这里插入图片描述
上传到服务器安装。
解压:
tar zxvf cudnn-11.3-linux-x64-v8.2.1.32.tgz
解压之后得到一个 cuda文件夹。采用如下的操作进行cudnn的安装。(这时候的cudnn要直接安装到对应的版本的cuda的真实的安装路径中。这样建立软连接的时候才会读到cudnn文件)

sudo cp cuda/include/cudnn.h    /usr/local/cuda-11.1/include # 填写对应的版本的cuda路径
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-11.1/lib64   # 填写对应的版本的cuda路径
sudo chmod a+r /usr/local/cuda-11.1/include/cudnn.h   /usr/local/cuda-11.1/lib64/libcudnn*

(5) Anaconda安装
在这里插入图片描述
sudo bash Anaconda3-2022.10-Linux-x86_64.sh安装。安装过程需要同意将安装路径加入到环境变量的配置文件中。
source ~.bashrc使其生效。

建立自己新的环境 conda create-n your_name python=your_version
激活新的环境 source activate your_name
(6) Pytorch安装(1.10.1)

pip install torch==1.10.1+cu111 torchvision==0.11.2+cu111 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html

测试

python  # 进入python 环境
import torch  # 导入安装的pytorch包
torch.cuda.is_available()  # 检查cuda是否可以使用

如果torch.cuda.is_available()如果输出是false,那就表示前面的驱动或者cuda的安装有问题,最可能的就是驱动。直接卸载重新安装显卡驱动即可解决问题。

参考:
1.https://blog.csdn.net/kingfoulin/article/details/98872965
2.https://zhuanlan.zhihu.com/p/527283224

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值