参考 https://devtalk.nvidia.com/default/topic/1002826/question-about-cudnnsetconvolution2ddescriptor/
https://blog.csdn.net/LJN101224/article/details/79386465
背景:matlab2018b,cudnn7,CUDA10.1,2080 ti(计算能力7.5)
由于2080 ti只能用CUDA10.1,造成了很大的麻烦,由于不需要太快的速度,只需要实现算法就行,最终放弃了cudnn搭建,只用CUDA,效果如下(只用CPU大概有230HZ,区别很明显):
参考另一篇文章的做法,舍弃cudnn编译,用下面的命令:
vl_compilenn(‘enableGpu’,true,‘cudaRoot’,‘C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1’,‘cudaMethod’ ,‘nvcc’)
期间出现如下错误:
" MatConvNet compiled with ‘-R2018a’ and linked with ‘-R2017b’ "
有这样一个文档写的解决方法,但不适用于新版本
https://blog.csdn.net/u014292102/article/details/80331481
我是这样解决的
把中间那一行修改为’-2018a’,…
2019.6.14晚
用Quadro M4000跑出来的结果,计算能力5.2