准确率、召回率和mAP、AP50/75

最新推荐文章于 2025-03-22 10:41:45 发布

dagongji10

最新推荐文章于 2025-03-22 10:41:45 发布

阅读量3.3w

点赞数 62

分类专栏：随手记

本文链接：https://blog.csdn.net/DaGongJiGuoMaLu09/article/details/90169467

版权

随手记专栏收录该内容

15 篇文章

订阅专栏

本文深入解析了精确率和召回率的概念，解释了两者在评估模型性能时的重要作用，包括PR曲线的意义及其与F1值的关系。同时，介绍了mAP的计算方法，以及COCO数据集中AP/AP50/AP75的具体含义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、准确率和召回率

真实值与预测值之间的关系如下左图所示，右图是二者之间的一个直观表示，同时也能清晰的看出准确率和召回率的具体含义。准确率 $P$ 给出了“预测为真值的样本中确实有多少比例为真值”，召回率 $R$ 则给出了“本来就是真值的样本模型预测出来了多少”。所以，准确率也称为“查准率”，它说明的是预测真值中有多少是对的；召回率也称为“查全率”，它说明的是真实真值中有多少被找到了。在这里插入图片描述准确率（precision）和召回率（recall）作为统计值，各自的计算方式（实例计算方式看这里）： $P=\frac{TP}{TP+FP} \\ R=\frac{TP}{TP+FN}$ 一般来说， $P$ 和 $R$ 是相互制约的，一个越高另一个就越低，统计上用 $P R$ 曲线来描述二者的关系。在这里插入图片描述对于一个抽样集合，模型的预测值和真实值都是确定的， $P$ 、 $R$ 也应该是一个确定的值，为什么会出现一条曲线？实际上如果是一个 $b a t c h = 128$ 的集合，我们并不是直接计算128个样本的 $P / R$ ，而是按照每个样本的置信度概率将它们从大到小排序，然后从第一个样本开始计算 $P / R$ ，然后加入第二个再计算 $P / R$ ，以此类推；这样 $R$ 的值就会一步步增大、逐渐接近1，而 $P$ 则逐渐下降，这也意味着模型的预测中有 $F P$ 的出现。
这里，在将样本一个个加入计算集合的过程中， $R$ 的值可能不变（也就是没有 $T P$ 出现），但是 $P$ 的值却发生改变（出现了 $F P$ ），这导致一个 $R$ 对应多个 $P$ ，这时我们只将最大的 $P$ 值考虑进来（同一 $R$ 值取最大 $P$ 值）。

PR曲线反映了模型对正例的识别准确度和识别覆盖能力之间的权衡。

从以上 $P R$ 曲线的性质可以看出，如果模型 $A$ 的 $P R$ 曲线包含了模型 $B$ 的 $P R$ 曲线，那么模型 $A$ 的性能要优于 $B$ 。但是如果二者发生交叉呢？下图就是实际应用中会经常看到的一组模型性能对比图。在这里插入图片描述如果 $P / R$ 值都很高，很难直接通过 $P R$ 曲线去比较哪个模型更好时，可以用 $F 1$ 值来替代衡量： $F1=\frac{2PR}{P+R}$ 另外，也可以观察平衡点 $P = R$ ，二者相等时的取值越大表明模型性能越好。

2、mAP

在论文中经常见到一种参数是 $m A P$ （平均均值精度），常见的目标检测数据集 VOC/COCO都是以此为衡量标准，它跟 $P R$ 曲线息息相关。先看一下 $A P$ 的计算，以2010年为界它有两种不同的计算方法，现在更常用的是第二种：

2010年以前：针对某一分类将召回率 $R$ 等距划分为十一个值 $[0, 0.1, 0.2, . . ., 1]$ ，对于每一个 $R$ 值计算对应的最大准确率 $P$ （从 $P R$ 曲线就可以查到），然后对这十一个 $P$ 值求均值，也就是 $A v e r a g e P r e c i s i o n$ 。
2010年以后：针对某一分类的 $n$ 个样本，假设它有 $m$ 个正例，每一个正例就对应一个召回率 $R$ 值（ $1 / m, 2 / m, . . ., 1$ ），对每一个召回率计算最大准确率 $P$ ，然后对这 $m$ 个 $P$ 值求均值。 $AP=\frac{1}{m}\displaystyle\sum_i^m{P_i}=\frac{1}{m}*P_1+\frac{1}{m}*P_2+\dots+\frac{1}{m}*P_m=\int{P(R)}dR$

注意到 $A P$ 是针对于某一个类的，而一个数据集往往包含相当多的分类，对数据集所有类的 $A P$ 求均值就得到 $m A P$ 。 $mAP=\frac{1}{C}{\displaystyle\sum_j^C{AP}_j}$ 所以， $m A P$ 中： $P$ 代表一个样本的最大准确率， $A P$ 代表一类样本的平均准确率， $m A P$ 就是数据集的平均准确率。

3、COCO数据集中的AP/AP50/AP75

对于图像分类任务， $m A P$ 针对的就是类识别准确率，但是在目标检测任务中还有一个边框回归任务，框的准确率一般用交并比来 $I o U$ 衡量。COCO数据集目标检测评价指标中， $A P / A P 50 / A P 75$ 指的是 $AP^{IoU=0.5:0.05:0.95}/AP^{IoU=0.5}/AP^{IoU=0.75}$ 。 $I o U = . 50 : . 05 : . 95$ 指的是交并比从0.5开始间隔0.05一直取值到0.95，然后求均值。
在这里插入图片描述
具体实例：