清楚明了:评估标准mAP的含义与计算
-
应用场景
在(目标/时序动作)检测中,对于识别出的每一个框都有(N+1)个是score,对应着N个class和1个background,选择最高的score作为最终的评判 -
定义
mAP:mean Average Precision ,即各类别AP的平均值
AP:P-R曲线下的面积
P-R曲线:precision-recall曲线
Precision:TP / (TP + FP),查准率,在检测出的正样本中,有多大比例是真正的正样本
Recall:TP / (TP + FN),查全率,在所有的正样本中,有多少被检测出来
TP: IoU>threshold的检测框数量(同一Ground Truth只计算一次)
FP: IoU<=threshold的检测框,或者是检测到同一个GT的多余检测框的数量
FN: 没有检测到的GT的数量
因此,threshold就成为影响Precision和Recall的关键因素。对于不同的threshold,就会有不同的Precision-Recall曲线,曲线下的面积也就是这个class的Average Precision。 -
mAP
也就是多个class 的Average Precision的平均值,即mean Average Precision
参考1:https://www.cnblogs.com/pinard/p/5993450.html
参考2:https://www.zhihu.com/question/53405779