TP(true positive):IoU > 0.5(并不一定是0.5,根据情况设定) 的边界框数量(同一Ground Truth只计算一次) ;
例如图中绿色框为人为标注的真实框,0.9的红色框则可视为检测成功的。
FP(False Positive,假阳性):IoU <= 0.5 的边界框数量(或者是检测到同一个GT的多余检测框的数量),上图中0.3的红色框即可视为假阳性
FN(False Negative):漏检的GT的数量。右下角的猫即为漏检的对象
Precision = TP/(TP+FP),即模型预测的所有目标中,预测正确的比例。(查准率)
但是仅凭此并不能准确评判网络的好坏,例如上图,FP=0,那么套入公式Precision就等于1了,查准率为100%,但是实际还有未检测的对象,所以仅凭此不能评判网络的好坏。
Recall = TP/(TP+FN),即所有真实目标中,预测到且预测正确的比例。(召回率、查全率)
同样如上图所示,当检测框的数量很多时,把所有对象都包含,且此时FN=0,没有漏检,此时recall是等于100%的,但是实际图中还有很多FP,所以仅凭此也不能表达网络的好坏。
所以据此有了如下评判标准:
AP: P-R曲线下面积
P-R曲线: Precision-Recall曲线
mAP: mean Average Precision, 即各类别AP的平均值