目录
1. 查看显卡版本命令:
nvidia-smi:GPU驱动版本,driverAPI(支持的最高cuda版本)。
watch -n 1 nvidia-smi:动态监控显卡状态。
nvcc -V:cuda版本,timeAPI(运行时API)。
2. 更新驱动:
2.1 下载显卡驱动
查看自己的显卡信息:
lspci | grep -i nvidia
根据自己的显卡信息去登录NVIDIA官方下载适合的驱动型号和版本:
选择对应自己的驱动版本并进行下载,保存为.run文件
2.2 安装前配置
-
-
- 验证系统是否安装gcc,g++,tar,make,如果没有安装,就手动配置yum源进行安装
-
gcc –v
g++ -v
yum install gcc gcc-c++ tar make
-
-
- 如果没有安装kernel-header包,使用本地的yum安装
-
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
-
-
- 如果系统已经安装了驱动,则进行卸载。出现xconfig选择yes
-
sudo /usr/bin/nvidia-uninstall
-
-
- 查询Nouneau模块是否运行,如果运行则需要禁用
-
lsmod | grep nouveau
如果有输出则表示运行,如果没有输出则表示禁用成功。
禁用则在以下文件内写入以下内容:
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
# 加入的内容:
blacklist nouveau
options nouveau modeset=0
在进入文件之后,按I表示插入,这是可以对文件内写入内容,然后按esc退出插入,按shift+:输入命令退出文件,输入q表示退出,输入wq表示保存并退出,输入wq!表示保存并强制退出。
文件写入保存退出之后,执行以下命令使内核生效,并重启服务器
dracut -f
systemctl set-default multi-user.target
Reboot
再次查看Nouneau模块是否运行,如果没有输出则禁用成功。
lsmod | grep nouveau
2.3 安装显卡驱动
上传下载好的驱动程序NVIDIA-Linux-x86_64-460.106.00.run到GPU节点(将文件上传至服务器)
赋予文件执行权限,并安装:
sudo chmod a+x NVIDIA-Linux-x86_64-460.106.00.run
sudo ./NVIDIA-Linux-x86_64-460.106.00.run
在安装过程中可能会显示一个问题:
选择NO继续
如果出现警告可以不用理会,直接接续。
直到安装完成
安装只后输入nvidai-smi,显示如下,则安装成功。
3. 下载更换cuda版本:
不同cuda版本的安装包:CUDA Toolkit Archive | NVIDIA Developer 下载所需的cuda
- 本文安装CUDA-11.1,更改cuda10.0->11.1
- 安装过程中,会问你是否需要下载驱动(Drive),正常情况下请不要下载,即选择否。
- 默认安装目录是/usr/local/,后面会多次提到
- vi ~/.bashrc末端加上配置信息
/usr/local中有cuda的软连接时:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
/usr/local没有cuda软连接时,直接硬链接
export PATH=/usr/local/cuda-xx.x/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH
source ~/.bashrc刷新配置文件,使得配置生效。
详细安装教程如下:
3.1 下载cuda:
- 到官网找到cuda版本,选择对应主机(服务器的)cp下载安装命令。
sudo sh cuda_11.1.1_455.32.00_linux.run
3.2 安装过程中遇到一些选项,同意协议accept
不要勾选 driver!!! ( 这里要按一下空格 ,即[ ]中没有X)
YES,替换旧的软连接
3.3 vi ~/.bashrc末端加上配置信息
以下配置二选一!!!
/usr/local中有cuda的软连接时:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
/usr/local没有cuda软连接时,直接硬链接
export PATH=/usr/local/cuda-xx.x/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH
source ~/.bashrc刷新配置文件,使得配置生效。
安装完成后输入nvcc -V,显示如下,安装成功
分别查看nvidia驱动和cuda版本,更新完成。
参考连接:
服务器,Linux,centos7成功安装显卡驱动(超详细)_嗨,紫玉灵神熊的博客-CSDN博客_centos7安装显卡驱动
Linux安装多个版本的CUDA,以及不同版本CUDA之间的切换使用(不同虚拟环境使用不同CUDA版本)-pudn.com
https://blog.csdn.net/qq_43885462/article/details/125668170?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~aggregatepage~first_rank_ecpm_v1~rank_v31_ecpm-1-125668170-null-null.pc_agg_new_rank&utm_term=cuda%E5%8D%87%E7%BA%A7&spm=1000.2123.3001.4430