前言
显卡驱动的版本特别重要,关系到能安装的CUDA版本。由于项目需要pytorch1.5,则要安装CUDA10.2,但还涉及到显卡驱动版本无法支持CUDA10.2。如下图对应,
使用nvidia-smi
查看自己的版本,明显驱动版本太低了,安装不了CUDA 10.2。
Nvidia驱动安装
装驱动时也遇到很多坑,尝试了很多方法,总是报错,比如关闭X服务问题等。最后也是稀里糊涂装成功了,但是没有选择指定版本的驱动。
主要参考https://www.it610.com/article/1294747311720701952.htm
,这个不用自己去下载驱动安装包。
步骤如下:
1、查看安装的nvidia模块命令
rpm -qa|grep -i nvid|sort
2、删除找到的模块
yum remove kmod-nvidia-390.87-1.el7_5.elrepo.x86_64 xorg-x11-drv-nvidia-384.81-1.el7.x86_64yum search kmod-nvidia nvidia-kmod-384.81-2.el7.x86_64
如果有错误提示“NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver”需要运行nvidia-uninstall
3、安装显卡检测程序
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
yum install nvidia-detect
4、 运行 nvidia-detect ,查看可安装的驱动
5、
安装基础包 yum install kernel-devel kernel-doc kernel-headers gcc\* glibc\* glibc-\*
安装刚才检测到的驱动 yum install kmod-nvidia
然后查看显卡
nvidia-smi
这个直接给我安装了最新的版本的驱动。而CUDA Version应该是能支持的最高版本的cuda。现在驱动已经更新成功,我们再回到CUDA10.2的安装。