YOLO V2 的mAP数据测试

最新推荐文章于 2024-05-11 20:26:46 发布

Lucky-ing

最新推荐文章于 2024-05-11 20:26:46 发布

阅读量1.8w

点赞数 6

分类专栏： YOLO 文章标签：物体检测神经网络

本文链接：https://blog.csdn.net/lucky__ing/article/details/78310510

版权

YOLO 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

我看到很多博客已经有了更加简单的方法。大家可以去看一下，直接使用fastrcnn的map脚本，本片博客是项目中用于评测网络的，并不是故意那么绕的，因为原版map计算和我们yolo采集的数据集有些不兼容，而且我们为了更加准确的判断，会在计算map的时候修改其iou数值，confidence数据，以及面积过滤，坐标过滤等，大家如果只是想求解map，建议转其他博客。博主看到一个教程比较简单，但是没有试过，原理是一样的。https://blog.csdn.net/LeeWanzhi/article/details/79690275 虽然态度不好，可能看起来比较简单吧。

正文

在yolo的官方上上显示，yolo v2具有76.8%的mAP，与SSD 500持平，单在fps上冥想的以碾压的优势胜出。除此之外，tiny-yolo也有着57.1%的mAP。之前博主一直在作yolov2和tinu-yolo的移植和改进，训练了接近3000张数据。但是经过实际的测试发现，tiny-yolo网络的实际效果并没有官网宣称的那么好，即使将迭代次数改为60000，也无济于事。但是yolov2网络的效果却是不容小觑的，基本博主的大部分检测物体都能够很好的识别。于是博主准备实际测量yolov2和tiny-yolo的实际的mAP值。

首先解释一下什么是mAP，目标检测中衡量识别精度的指标是mAP（mean average precision）。多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，AP就是该曲线下的面积，mAP是多个类别AP的平均值。以上介绍来自于知乎论坛。具体的信息可以去百度或者google搜索。
因为是使用的voc规范的数据集，所以应该有训练图片的源文件，xml文件。但是这些文件并不能被yolo网络直接检测，需要转为描述文件，即每张图片对应的描述文件txt，里面记载每张图片出现检测物体的类别，位置，大小。但是对于fast-rcnn里面的mAP计算程序来说，他需要的确实另外一种格式，博主在进行格式转换的时候出了很多bug，所以现在将训练个voc格式和识别的格式统一起来，方便于mAP值的测定。
要测量训练出的网络的效果首先要有一定数量的测试数据集。测试数据集需要有图片和每张图片对应的xml描述文件，而不需要有txt的描述语言，所以相对来说还少了一步转换。使用
./darknet detector valid cfg/voc.data cfg/lucky-voc.cfg backup/lucky-slippers-color_30000.weights -out 123 -thresh 0.5
以上代码是使用的yolo网络自带的valid函数接口来测试大量的图片，然后保存在123.txt文件里，也可以是其他的文件，名字，位置自己决定。
首先cfg/voc.data里面是一些路径的描述，具体内容为
classes= 1 train = /home/lucky/open/tuoxie_VOC/train.txt valid = /home/lucky/open/tuoxie_VOC/valid.txt names = data/voc.names backup = backup
因为我的识别物体只有一个，所以class为1，train是指的训练的数据地址描述文件，valid是值测试的地址描述文件。后面的name是类别描述文件，backup一般是训练的时候存储的路径。我们需要修改的只有valid这一项，指向需要测试的文件名。
cfg/lucky-voc.cfg是指的配置文件，和训练，检测时一样。
backup/lucky-slippers-color_30000.weights是指你使用的权重。
-out 是参数，输出到后面紧跟着的文件名。
-thresh是输出阀值参数，然而在实际测试的时候并没有什么作用，因为源代码中并没有被设定。这里我设为0.5.
运行完这一句话，之后darknet开始加载权重文件，然后根据你提供的测试文件的目录开始逐个识别检测。最后运行完之后，图片如下

(we use gpu!!!忽略不看，这是博主之前在测试gpu和cpu速度的时候输出)
接着就可以在文件./results/看到刚才的输出文件123tuoxie.txt，yolo会把识别到的东西分类，然后在自定的名字之后加上类别名，就像这里的123tuxie一样。。。
里面的内容也是有些奇怪，貌似并没有什么逻辑，不是是不是博主的操作不对，还是博主在之前优化的时候不小心改了yolo的源码。（从数据上看，设定的阀值确实没有用。源码中也可以看到。）

先不管那么多，下面开始mAP的计算。mAP的计算是使用的fast-rcnn里的voc_eval函数。博主修改了一下，可以更直接的得到我们想要的数据。首先确定的是所有的测试图片都和其对应的xml文件在一起，不然寻找匹配的描述文件的时候会出错。请注意，所有分类的图片都要放在同一个目录！！！就像下图一样

其次将计算的源码下载到本地，很小的文件voc-eval-github

git clone git@github.com:lucky-ing/voc_eval.git

里面只有一个文件123.py，使用

python 123.py /home/lucky/yolo/darknet/results/123tuoxie.txt /home/lucky/open/tuoxie_VOC/valid.txt tuoxie

/home/lucky/yolo/darknet/results/123tuoxie.txt是指刚才测试后的数据地址。/home/lucky/open/tuoxie_VOC/valid.txt，是测试的图片地址描述文件，和上面的voc.data是同一个文件。第四个参数tuoxie，是我们要计算mAP的类别名。然后，回车，运行，

不同的class有不同的valid文件，所以不同的分类需要一个一个测试。