语义分割之OCR的评判标准

参考:中文文字检测与识别的评测方法

Challenges 4使用的评测方法

1. 介绍

不同于Challenges 1和2,是Challenges 4标定的框多种多样,并不是水平的,如果像之前那样可能各种匹配形式会很复杂。Challenges 4的评测方法采用简单的计算IoU来进行评测,在Challenges 4中标定框与检测框都为多边形而不是之前的水平矩形了。

2. 具体方法
  1. 针对每张图片,创建一个n x m大小的矩阵(称为iouMat),其中n为标定框的个数(GT),m为检测到的框个数(Det)。
    i o u M a t i , j = a r e a ( i n t e r ( g t i , d e t j ) ) a r e a ( u n i o n ( g t i , d e t j ) ) iouMat_{i,j} = \frac{area(inter(gt_i, det_j))}{area(union(gt_i, det_j))} iouMati,j=area(union(gti,detj))area(inter(gti,detj))
    注: g t i 、 d e t j gt_i、det_j gtidetj分别表示第i个标定框和第j个检测框,inter()表示求两个矩形框的交际,union()表示求两个矩形框的并集,area()表示求的面积

  2. 定义IoU阈值(一般0.5),统计iouMat中大于阈值的个数,记为TP

    • recall的分数:TP/GT
    • precision的分数:TP/Det
    • ap(average precision)的分数:在检测的输出结果中要输出一列每个检测框的置信度,首先将置信度排序,每有一个符合条件(这里的条件就是3中大于0.5的检测框)的框,计算此时的准确率(计算方法为当前满足条件的框的个数除以已检测出的框的个数),将所有满足条件的框计算出来的准确率相加,最后除以除以gt个数(这里的gt个数同上,除去了文本标定为###的框),得到每张图片的ap指标。若要算整个测试集的map,同理,只是框个数变成的整个测试集的框个数。

注, 要说明的是,如果检测到的是长文本,但是标定的是单个字,这时候检测可能会算为检测不准确,这是这个评测方法的缺陷

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值