目标检测等相关评价指标（AP AR Average Precision和Average Recall）

最新推荐文章于 2025-03-30 22:08:52 发布

SophiaCV

最新推荐文章于 2025-03-30 22:08:52 发布

阅读量1.1w

点赞数 9

分类专栏：计算机视觉

在公众号【计算机视觉联盟】后台回复【9076】获取独家200页AI笔记！

本文链接：https://blog.csdn.net/Sophia_11/article/details/108281048

版权

计算机视觉专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍了COCO数据集上用于评估目标检测器性能的12种关键指标，包括平均精度(AP)和平均召回率(AR)的概念，以及它们在不同IoU阈值、目标大小和类别下的应用。同时，文章还阐述了这些指标如何帮助识别检测器在小、中、大目标上的表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://cocodataset.org/#detection-eval

COCO 提供了 12 种用于衡量目标检测器性能的评价指标.

[1] - 除非特别说明，AP 和 AR 一般是在多个 IoU(Intersection over Union) 值间取平均值. 具体地，采用了 10 个 IoU阈值 - 0.50:0.05:0.95. 对比于传统的只计算单个 IoU 阈值(0.50)的指标(对应于这里的指标 APIoU=0.50)，这是一种突破. 对多个 IoU 阈值求平均，能够使得目标检测器具有更好的定位位置.

[2] - AP 是对所有类别的求平均值. 这在传统上被称为平均准确度(mAP, mean average precision). 这里并未区分 AP 和 mAP(类似的，AR 和mAR)，假定从上下文中具有清晰的差异. 即：如，AP50=mAP50，AP75=mAP75，... 但，AP50 一定大于 AP75.

[3] - AP (所有 10 个 IoU 阈值和全部 80 个类别的平均值) 作为最终 COCO竞赛胜者的标准. 在考虑目标检测器再 COCO 上的性能时，这是单个最重要的评价度量指标.

[4] - COCO数据集中小目标物体数量比大目标物体更多. 具体地，标注的约有 41% 的目标物体是都很小的(small, 面积< 32x32=1024)，约有 34% 的目标物体是中等的(medium, 1024=32x32 < 面积 < 96x96=9216)，约有 24% 的目标物体是大的(large, 面积 > 96x96=9216). 面积(area) 是指 segmentation mask 中像素的数量.

[5] - AR 是指每张图片中，在给定固定数量的检测结果中的最大召回(maximum recall)，在所有 IoUs 和全部类别上求平均值. AR 与 proposal evaluation 中所使用的相同，但这里 AR 是按类别计算的.

[6] - 所有的评测指标允许每张图片(在全部的类别中)最多 100 个 top-scoring 检测结果进行计算.

[7] - 边界框(bounding boxes)的检测和segmentation mask 的所有评测指标是一致的，除了 IoU 的计算. 边界框的 IoU 计算是关于 boxes的，而 segmentation mask 的 IoU 计算是关于 masks 的.

学习参考：https://www.aiuai.cn/aifarm854.html