Challenges 4使用的评测方法
1. 介绍
不同于Challenges 1和2,是Challenges 4标定的框多种多样,并不是水平的,如果像之前那样可能各种匹配形式会很复杂。Challenges 4的评测方法采用简单的计算IoU来进行评测,在Challenges 4中标定框与检测框都为多边形而不是之前的水平矩形了。
2. 具体方法
-
针对每张图片,创建一个n x m大小的矩阵(称为iouMat),其中n为标定框的个数(GT),m为检测到的框个数(Det)。
i o u M a t i , j = a r e a ( i n t e r ( g t i , d e t j ) ) a r e a ( u n i o n ( g t i , d e t j ) ) iouMat_{i,j} = \frac{area(inter(gt_i, det_j))}{area(union(gt_i, det_j))} iouMati,j=area(union(gti,detj))area(inter(gti,detj))
注: g t i 、 d e t j gt_i、det_j gti、detj分别表示第i个标定框和第j个检测框,inter()表示求两个矩形框的交际,union()表示求两个矩形框的并集,area()表示求的面积 -
定义IoU阈值(一般0.5),统计iouMat中大于阈值的个数,记为TP
- recall的分数:TP/GT
- precision的分数:TP/Det
- ap(average precision)的分数:在检测的输出结果中要输出一列每个检测框的置信度,首先将置信度排序,每有一个符合条件(这里的条件就是3中大于0.5的检测框)的框,计算此时的准确率(计算方法为当前满足条件的框的个数除以已检测出的框的个数),将所有满足条件的框计算出来的准确率相加,最后除以除以gt个数(这里的gt个数同上,除去了文本标定为###的框),得到每张图片的ap指标。若要算整个测试集的map,同理,只是框个数变成的整个测试集的框个数。
注, 要说明的是,如果检测到的是长文本,但是标定的是单个字,这时候检测可能会算为检测不准确,这是这个评测方法的缺陷