首先参考下面几篇文章安装darknet,cuda的基础环境:
Yolov3网络的物体检测_tugouxp的专栏-CSDN博客1.Get darknet 代码$ git clone https://github.com/pjreddie/darknet$ cd darknet$ makecaozilong@caozilong-Vostro-3268:~/yolo$ git clone https://github.com/pjreddie/darknet正克隆到 'darknet'...remote: Enumerating objects: 5937, done.remote: Total 5937 (dehttps://blog.csdn.net/tugouxp/article/details/119297898YOLOV3训练环境的搭建_tugouxp的专栏-CSDN博客YOLOV3推理环境搭建参考文章:Yolov3网络的物体检测_tugouxp的专栏-CSDN博客1.Get darknet 代码$ git clone https://github.com/pjreddie/darknet$ cd darknet$ makecaozilong@caozilong-Vostro-3268:~/yolo$ git clone https://github.com/pjreddie/darknet正克隆到 'darknet'...remote: Enumerating objhttps://blog.csdn.net/tugouxp/article/details/121303495https://blog.csdn.net/tugouxp/article/details/121248457https://blog.csdn.net/tugouxp/article/details/121248457Ubuntu18.04安装CUDA深度学习环境_tugouxp的专栏-CSDN博客N卡在深度学习领域具备无可替代的地位,这里记录以下在我这台配备GF MX350 N卡笔记本 上安装cuda以及cuNN的具体步骤。MX350属于低端显卡了,一开始我还担心它会不会不支持CUDA,后面确认了一下,发现可以支持。关于确认N卡是否支持CUDA以及支持版本的具体步骤,可以参考我的这篇博客:如何确定PC Nvidia显卡是否支持CUDA以及cudaNN?过程不难,细节很多,下面记录具体步骤:1.安装显卡驱动:...https://blog.csdn.net/tugouxp/article/details/119829792https://blog.csdn.net/tugouxp/article/details/121248457https://blog.csdn.net/tugouxp/article/details/121248457
安装CUDANN
Nvidia显卡驱动和CUDA驱动安装好之后,通过nvidia-smi命令验证安装效果,如果出现下面的界面,则证明安装OK
之后,就可以打开darknet/Makefile中的配置FLAG, GPU=1,OPENCV=1(事先安装OPENCV)
即可编译成功,但是此如如果打开CUDANN=1,则会报告如下错误:
所以,安装CUDA NN是我们不得不进行的一道工序,它独立于CUDA环境的安装,下面开始。
CUDANN安装地址在:
意外的是和安装CUDA和N卡驱动的白嫖不同,下载CUDANN还需要注册,胳膊宁不过大腿,还是先从了吧。
登陆成功后的界面,黄老板真帅。
之后就可以下载了:
因为我们安装的是CUDA11.5,所以我选择的版本是
cuDNN Runtime Library for Ubuntu18.04 x86_64 (Deb)
视需求可以下在别的资料,比如文档,由于我们是拿来使用而非基于它二次开发,所以不选择开发者版本。
下载过来的CUDA DEB包是这个样子, 虽然是库,但也不小了,果然如其名,又粗又大。
安装:
安装后重开会话,重新编译darknet还是遇到同样的错误,查看DEB包内容,发现确实没有cudann.h文件。
怀疑是下错包了,选择名字顺眼的(带有Library)的重新下载:
cuDNN Library for Linux (x86_64)
下载后:
解压后,确实有我们需要的头文件:
安装过程极其简单,只需要手动将cuda目录中的include,lib64目录拷贝到/usr/local/cuda-11.5/include 和 /usr/local/cuda-11.5/lib64两个目录即可
之后编译:
执行推理:
这次推理用了449.553000ms,至此,cudaNN安装总算完成了。
关于算力:
MX250显卡算例水平和GT550M相当,总体在2.0T略高的水平,虽然和高端显卡没法比,但是比嵌入式端侧产品中的动辄零点几TFOPS的NPU相比,还是强大很多的。
数据来源:
CUDA GPU | NVIDIA Developerhttps://developer.nvidia.com/zh-cn/cuda-gpus#compute