最近在做一个目标检测的练习项目——阿里天池的宫颈癌检测初赛任务,用了MMDetection中自带的Faster RCNN网络,好不容易把网络跑通,但是测试网络的时候发现自己看不懂评价指标...在此将相关的评价指标及其含义记录一下,供自己和其他初学者参考。
1.TP(True Positive):IoU>0.5的检测框数量(同一Ground Truth只计算一次)。
2.FP(False Positive):IoU<=0.5的检测框数量(或者是检测到同一个GT的多余检测框的数量)。
3.FN(False Negative):没有检测到的GT的数量。
4.Precision:TP/(TP+FP)模型预测的所有目标中,预测正确的比例,因此又叫查准率。
倘若有5个GT,但是只检测出1个目标(匹配到某个GT且IoU>0.5),此时TP=1,FP=0,Presicion=100%。
5.Recall:TP/(TP+FN)所有真实目标中,模型预测正确的目标比例,因此又叫查全率。
倘若有5个GT,但检测出了50个目标(5个GT中均分配到了IoU>0.5的目标框),此时TP5,FN=0,Recall=100%。
因此只看Precision或者只看Recall并不能实际反映出模型检测效果的好坏。
6.AP:P-R曲线下面积
7.P-R曲线:Precision-Recall曲线
8.mAP:Mean Average Precision,即各类别AP的平均值。
以上为COCO官网给出的指标解释。
以上述结果为例,第一列(从左到右的顺序)为AP和AR两个评价指标;第二列为IoU的取值,0.50:0.95表示以0.05为步长,共10个IoU阈值求平均作为最后的输出结果;0.50为PASCAL VOC数据格式采用的阈值,0.75则更加严格(要求定位更加准确);第三列表示目标面积,all为所有目标,small、medium和large为小中大目标,具体划分标准在官网给出的图片上有,可以根据自己的数据集关注不同大小目标的检测情况;第四列为最多生成的检测框数量,可自行更改,若每张图像只有一个目标,则100和300不会有很大差别,反而最多生成100个检测框的效率会高一些;最后则是上述不同条件组合的数值输出。
最后附上B站视频讲解,可能会更加直观一些,喜欢的小伙伴可以去看看。本文仅作为学习记录,如有不足望批评指正。