配置:2080TI,cuda9.1, cundnn7.5.0 ,Nvidia驱动430,Ubuntu16.04+内核4.10.0
执行caffe出现问题:
Check failed: status == CUDNN_STATUS_SUCCESS (8 vs. 0) CUDNN_STATUS_EXECUTIO
编译darknet 取消cudnn可以通过,但是测试demo 时,没有结果,这就奇怪了
好下面分析:
方法一(建议试下):
RTX 2080ti博主唯一没有尝试的是重新更新一下驱动 将430改为410
注:还有一种说RTX 2080ti 只支持cuda10.0以上版本
http://blog.sina.com.cn/s/blog_44b795c20102wsnu.html这个换驱动解决,但是stackflow和github都没有对这个问题有完整的解答。
-
下载NVIDIA 410版本驱动放到目录下
-
Ctrl+alt+F1 进入指令界面
-
删除原来的nvidia驱动
sudo apt-get remove --purge nvidia*
- 关闭lightdm
sudo service lightdm stop
- 运行驱动文件
sudo ./NVIDIA-Linux-x86_64-410.78.run --no-nouveau-check--no-opengl-files
- 重启lightdm
sudo service lightdm start
- Ctrl+alt+F7 退出指令界面
- 在终端输入:nvidia-smi测试下
这种方法我没试,换个驱动代价小,可以试下
方法二(完美解决):
- 这个问题讲的是cudnn的问题,但是检测下cuda版本和cudnn版本完全对应着,9.1和图形驱动版本(430)大于390.46,也ok
-
驱动430的问题?在nvidia驱动官网匹配下:
430和410驱动都支持2080ti, ok -
内核版本问题?
ubuntu16.04安装cuda都要求内核4.4版本(查看官网安装向导),其他的内核博主不确定,好将原来的4.10内核降为4.4
查看内核:
uname -a
换内核一定要小心,查看博主另一篇https://blog.csdn.net/weixin_38632246/article/details/91353602
下载三个内核文件必须匹配,安装完一定要卸载原来的内核,同时更新grub,亲测,负责会崩掉(不行就重装4.4的内核系统吧)