mAP指标

夜信_

已于 2022-09-10 09:34:08 修改

阅读量2k

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉目标检测

于 2022-09-09 16:44:24 首次发布

本文链接：https://blog.csdn.net/qq_42454156/article/details/126785486

版权

深度学习专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了目标检测任务中的评估指标，包括TP、FN、FP的计算方式，以及在IOU阈值下的P-R曲线和平均精度(AP)的求解过程。文章指出，高阈值下的mAP提升并不一定意味着定位性能改善，同时强调了FP的影响取决于其与TP的关系。此外，还介绍了如何根据IOU和置信度判断预测框的正负，并用于计算精确度和召回率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先强调一些概念，这里假设目标检测任务是单类别：
【1】分类任务中，一个图片对应一个标签和一个预测。而目标检测任务，一个图片对应有m个标签（bbox）和n个预测（score+bbox）。一个图片可能就没有目标m=0，也可能模型啥都没有预测出来n=0。
【2】标签就一个bbox，因为是单类别。 bbox是一个四个数值（x1,y1,x2,y2）。
【3】预测的每个bbox还对应这一个score，表示这个框是否为目标的一个概率
【4】如下图，TP，FN，FP可计算，但TN不可计算。原因是标签的bbox和预测的bbox都只表示图像中哪个位置是目标物体，除此之外的都是非目标物体。这样的话TN就有无穷多个。
在这里插入图片描述

【5】TP，FN，FP如何计算？

若某个标签bbox与某个预测bbox的IOU大于IOU_T（一个阈值，比如70%），则TP+=1。
如果没有任何预测的bbox与某个标签bbox的IOU大于IOU_T，说明这个正例bbox未被预测出，则FN+=1
如果没有任何标签的bbox与某个预测bbox的IOU大于IOU_T，说明这个预测的正例是假的，则FP+=1
【6】再在上述基础上套上score，算P_R曲线，再算AP。这里就直接上例子吧。

在这里插入图片描述

image x 为图片，一张图片上可能有许多个gt，也有可能没有gt，detections是网络预测的多个预测框，一个图片上可能会存在多可预测框（用A-Z进行编码）。

首先确定每一个预测框（A-Z是正还是负）, 即大于IOU阈值的为正，小于的为负。并且一个gt只能算一次，也就是两个预测框对于同一个gt都满足了IOU大于阈值，但是只有IOU最大的一个算是正，剩下的算是负（疑问，a，b 对于gt1的IOU都大于阈值， a的iou更高， b对于gt2的IOU也大于阈值， b是否会在处理gt1的时候直接被设置成负？）

然后，Confidence从高到低一，大于的，正的变成TP，负的变成FP，然后剩下 #gt - TP 个 FN。
在这里插入图片描述