linux redhat7 升级NVIDIA显卡驱动步骤

本文档介绍了在Redhat7服务器上升级NVIDIA显卡驱动的详细步骤,包括关闭Nouveau、下载驱动文件、在文本模式下执行安装等关键环节,旨在解决使用NVIDIA GPU时遇到的问题。

1 背景

前面在redhat7服务器上升级了tensorflow1.0,发现GPU用不了
根据教程,测试GPU:

# 新建一个 graph.
import tensorflow as tf
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
# 新建session with log_device_placement并设置为True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# 运行这个 op.
print sess.run(c)

报错:

failed call to cuInit: CUDA_ERROR_NO_DEVICE
retrieving CUDA diagnostic information for host: ml-login2

测试cuda状态:

[root@xxxx ~]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

测试GPU:

% nvidia-smi
报错:
  Failed to initialize NVML: Driver/library version mismatch

注:nvidia-smi(The Nvidia System Management Interface)是Nvidia显卡命令行管理套件,基于NVML(Nvidia Management Library)库,旨在管理和监控Nvidia GPU设备

查了半天,确定是要更新nvidia driver

2 更新步骤

可以看:
http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#handle-uninstallation

2.1 关闭Nouveau

2.1.1 linux默认安装的是nouveau的显卡驱动,它并不属于nvidia驱动。 要安装nvidai驱动,需要先停止Nouveau

先检查nouveau是否运行:

$ lsmod | grep nouveau

如果有,说明nouveau在运行,需要停止:

2.1.2. 在 /etc/modprobe.d/blacklist-nouveau.conf 文件中加入一下两行:
blacklist nouveau
options nouveau modeset=0
2. 重新生成kernel initramfs
$ sudo dracut --force

2.2 下载驱动文件

在官网下载合适的驱动文件
http://www.nvidia.cn/Download/index.aspx?lang=cn
我下的是 NVIDIA-Linux-x86_64-375.39.run

2.3 关于文本模式

升级显卡驱动,需要从窗口模式进入文本模式(即命令行模式)。 因为阿里云hpc本身就是在文本模式下,所以不需要设置。
可以通过以下方式查看centOS7 (包括redhat7)当前模式:

$ ll /etc/systemd/system/default.target
  systemctl set-default multi-user.target  表明是文本模式
  systemctl set-default graphical.target   表明是窗口模

需要设置的话,参考http://www.cnblogs.com/lanston/p/3880577.html

2.4 执行安装文件

$ sh NVIDIA-Linux-x86_64-375.39.run

过程中需要选择一些选项(已经不记得了)。
最后

$ reboot

DONE!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值