linux重启之后No CUDA-supporting devices found!

实验室做并行计算的服务重启后,采用cuda接口的应用程序vasp_gpu,运行时提示:

CUDA Error in cuda_main.cu, line 144: unknown error

No CUDA-supporting devices found!

在Nvidia开发者论坛https://devtalk.nvidia.com/ 找到相关主题下的回答,

When you first boot up the system in console mode, the nvidia driver is not loaded and the GPU device is not available. One benifit of this , is that more host memory is free。

即重启之后GPU是默认关闭的,需要手动打开。

(修正:实际上是默认关闭persistence mode持续模式。persistence mode能够让GPU更快响应任务,代价是待机功耗增加。关闭persistence mode同样能够启动任务。但有些程序自己有bug启动不了)

 

$nvidia-smi

 

 

解决方法:打开persistence mode持续模式

root账户下操作

#cd /usr/local/cuda/sample/1_Utilities/deviceQuery

#./deviceQuery

#nvidia-smi -pm 1

 随后我们查看GPU状态。Persistence-M从Off变成了On,持续模式已打开。

$nvidia-smi

 

DeviceQuery是NVIDIA自带的设备查询程序,它实际上是一个sample,需要编译后才能使用。 在 cuda根目录/.../cuda/samples/1_Utilities/deviceQuery下用make编译

这里给出了一个运行结果示范:http://blog.csdn.net/u012033124/article/details/70740119

nvidia-smi 即NVIDIA system manager interface是GPU 的控制程序,同时也能够监视GPU的运行状态。详细参数通过nvidia-smi -h命令查看帮助文档。

这里有一个简单的介绍 http://www.microway.com/hpc-tech-tips/nvidia-smi_control-your-gpus/

 

转载于:https://www.cnblogs.com/kaikaikai/p/6907766.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值