记录VS2015编译cuda11+opencv库遇到的问题

上片博客是具体的配置教程,本篇升级了cuda11版本,然后记录遇到的问题及解决方法

最近公司买来了新的30系显卡(3080ti),搜了下30系显卡架构变了,必须装cuda11版本

参考:

30 系列显卡是新一代架构,新驱动不支持 cuda 9 以及 cuda 10,所以必须安装 cuda 11_kyle-fang的博客-CSDN博客_cuda版本11一定要安装11吗

装了cuda11,还是配置opencv3.2.0+cmake3.18,可以成功Configure,但是Generate一直报错如下:

CMake Error: The following variables are used in this project, but they are set to NOTFOUND.
Please set them or make sure they are set and tested correctly in the CMake files:
CUDA_nppicom_LIBRARY (ADVANCED)

 搜了搜,说是cuda11不支持nppicom了,然后我就去修改cmake下的FindCUDA.cmake了,参考:CUDA 11.x CMAKE Error CUDA_nppi_LIBRARY (ADVANCED)_溯雪pro的博客-CSDN博客_cuda 11.x发现没用

然后又参考了一些博客的方法:

1.参考CMAKE ERROR: CUDA_nppicom_LIBRARY (ADVANCED)_ipanda_zll的博客-CSDN博客

这位老哥是直接把cuda版本降到cuda10

我尝试按照他写的又升级了cmake到最新版cmake3.25,发现没用

2.参考CMake Error: CUDA_nppi_LIBRARY (ADVANCED)_dawn_chen123的博客-CSDN博客_cuda_nppi_library

这个他写的那一句我不知道在哪里加,因为我是win10

3. 看了一些Stack Overflow上面的回答 

Build OpenCV-4.0.0 with cuda 11 on Ubuntu 18.04 - Stack Overflow

最终参考:Ubuntu18.04+CUDA11.2+opencv4.3.0:CUDA_nppicom_LIBRARY (ADVANCED)报错解决_NENGSHUIYIZHOU的博客-CSDN博客_cuda_nppicom_library

我把opencv版本提高到了opencv4.4.0,问题解决了 (cmake3.25+cuda11.0+opencv4.4.0编译成功)

接下来编译opencv.sln遇到的问题

问题一:“错误 C2131 表达式的计算结果不是常数”。解决方法:在错误列表中找到该错误第一行行,会自动定位到\gapi\own\mat.hpp文件中的一行,如下: 

            #define TABLE_ENTRY(type)  {assign_row<type, 1>, assign_row<type, 2>, assign_row<type, 3>, assign_row<type, 4>}
            static constexpr func_p_t func_tbl[][max_channels] = {
                    TABLE_ENTRY(uchar),
                    TABLE_ENTRY(schar),
                    TABLE_ENTRY(ushort),
                    TABLE_ENTRY(short),
                    TABLE_ENTRY(int),
                    TABLE_ENTRY(float),
                    TABLE_ENTRY(double)
            };

   将static constexpr中的constexpr改为const,成功编译,参考:VS2015+CMake+opencv4.1+opencv_contrib4.1编译方法及出现的问题_Natsume_Kagura的博客-CSDN博客

问题二:

这些我记得之前编译opencv320的时候有了呀,4.4.0的目录里没有了

参考:【OpenCV】编译opencv_contrib模块_CA727的博客-CSDN博客_无法打开包括文件: “vgg_generated_120.i”: no

可以下载下来,我是去opencv320里粘贴过来的 

 问题三:编译ade报错

这什么鬼?在cmake时直接把它的勾去掉,除此之外把一些test也都去掉重新configure和generate

ok编译成功

But

我还是想编opencv3.2,因为公司软件架构就是3.2.0的,我一想是因为opencv版本到4.4.0以后才解决的 CUDA_nppicom_LIBRARY (ADVANCED) 的问题,那改cmake的FindCUDA没用的话就去找opencv目录里的cmake了,发现FindCUDA.cmake其实差不多。我又找带cuda的cmake文件,我去,重大发现,OpenCVDetectCUDA.cmake文件里果然又出入

左边是opencv320,右边是opencv440,还是cuda11不支持nppicom的原因,我把右边红框添加到左边,重新generate,问题解决了!

当然了,编译opencv.sln时自然也少不了报错,就这么难,特么的

问题一:

诶,这不和上一篇的问题四一样吗,那个是cuda10不支持2.0架构,把CUDA_ARCH_BIN里的2.0删了,那这回把3.0也删了

其实cuda11支持30显卡,CUDA_ARCH_BIN那应该是8.6起步,我看cmake最新版也没到8.6,那么编译时就会遇到很多warnning,耽误时间

参考【问题解决】安装PCL报错:nvcc fatal : Unsupported gpu architecture ‘compute_30‘_ghgou的博客-CSDN博客_cuda_arch_bin

计算架构说的就是Compute Capability

 ok,大功告成

返回过头来看看,其实cmake时好多都不用勾选的,我也不懂那些都是啥,可能编译了一些没用的东西占用时间,最后反正我只要我需要的就行了


2023.1.29更新笔记

一、vs2015不支持cuda11.3,支持cuda11.1,cuda11.2不确定

二、cuda11.1编译opencv320,cmake中CUDA_ARCH_BIN最高支持到6.1,再高的话编译OpenCV.sln会报错:identifier "__shfl_down" is undefined,怀疑是opencv本版过低

三、我的显卡是RTX A4000,对应算力8.6,故升级opencv版本到4.4.0,再将CUDA_ARCH_BIN改成8.6可成功编译 

四、 显卡算力查找网址:CUDA GPUs - Compute Capability | NVIDIA Developer

nvidia算力网址: 

CUDA GPUs - Compute Capability | NVIDIA Developer 

公司常用的:RTX 1080->6.1,P4000->6.1,30系是8.6,20系是7.0,7.5,MX250->6.1,GTX 940M->5.0 

五、显卡对应算力和cuda支持算力的匹配规则: 

参考:NVIDIA Ampere GPU Architecture Compatibility

意思是说,显卡GPU对应算力要大于cuda版本支持的最高算力,注意是在同一主版本号上作比较

硬件才是最终限制
因此我编译的opencv库要兼容各种显卡,那么CUDA_ARCH_BIN就都写上,注意3.0已被30系显卡废弃,写上会报错

六、查看本机显卡算力的方法:

cmd控制台,进入C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\extras\demo_suite目录下,运行deviceQuery.exe会显示如下图

 七、cmake生成opencv库时,把BUILD_opencv_world打勾,这样其它库会合成一个opecv_world.lib和opencv_world.dll,再拷贝时方便一些

八、 cuda目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin下也有一些dll,软件发布时会依赖,将用到的都打包到软件包里,比如cudart64_80,cufft64_80,nppi64_80,nppc64_80,npps64_80等,以免出现软件缺库、崩掉等问题

九、 vs2015+cuda11.1+opencv440编译opencv.sln时,会报以下的warning,导致编译很慢

        1.vs版本过低,要我升级到2017/2019

        2.cuda的thrust库也需要2017及以上版本

更换成cuda11.0就没有warning

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值