解决了一个问题,然后不总结不做笔记,下次遇到还是要从头做起,费时费力,要养成总结的习惯。
这两天晚上在自动化学院帮基友爬坑,之前自己复现的时候,没遇到过,换个环境又出现了各种问题,写个博客记录一下。
在ubuntu下,这种右下角有黑色箭头的文件夹 理解为 类似 Windows系统下的快捷方式。你用 ls -l 文件夹名
可以看到如下图:
也就是说 cuda 这个文件夹实际上指向的是 /usr/local/cuda-9.0 ,也就是后者的一个快捷方式
错误1: 执行测试的时候,feedforward刚开始就提示 Layer conv1_1 has unknown engine.
解决办法: 试试把 prototxt files 里面的 engine: CUDNN 改成 CAFFE
错误2:Check failed: status == CUDNN_STATUS_SUCCESS(4 vs. 0) CUDNN_STATUS_INTERNAL_ERROR,报错如下图
解决办法:因为你没有permission使用cudnn引擎,命令前加 sudo即可,我是这样解决的。具体参考:https://github.com/shicai/MobileNet-Caffe/issues/3
错误3:Adding Shared libraries to System library path (怎么添加共享库到系统库的路径里), 你用ubuntu编译AI相关的代码,老是报什么 NO such file or directory 的错误, 但是你明明有这个文件或者目录,很明显系统只是没有搜索到你这个文件而已,你需要从路径下手解决. .so 文件就是 shared object的缩写,只要是关于 找不到 .so.等的问题都应该从路径下手(前提你的软链接没问题).
参考:http://howtolamp.com/articles/adding-shared-libraries-to-system-library-path/ 这个需要梯子,我截个图吧,方便启发有同样错误的老哥们.
错误4:CUDA runtime error (30) might show if your program is unable to create or open the /dev/nvidia-uvm device file. This is usually fixed by installing package nvidia-modprobe:
解决办法:
sudo apt-get install nvidia-modprobe 参考:
https://github.com/NVIDIA/DIGITS/issues/1663
错误5:libcudart.so.7.5: cannot open shared object file: No such file or directory ,错误如下
如果你花了2晚上找解决办法然后试了一遍都没解决,试试
就是把提示缺少的这个文件拷贝到 /usr/lib 下面
因为是当做笔记,没说的很详细,有问题可以留言,一起讨论。