一:OCR字测试指标
1:字段说明
H:识别正确的字符个数;H=N-D-S
D:漏识别的字符个数;删除错误
S:识别错误的字符个数;替换错误
I:多识别错误的字符个数;插入错误
N:人工标注的字符总数
2:字的效果统计
①字的准确率corr(correction):在所有标注字符中,识别正确的字符占比:
corr=H/N
②字的精确率acc:acc=(H-I)/N
3:要素效果统计(整句话)
corrH:表示完全识别正确的要素数量;
labN:表示标注的要素总数;
extractN:表示引擎抽取要素总数;
①要素抽取准确率:pression=corrH/extractN
②要素抽取召回率:recall=corrH/labN
③F1=(2* pression*recall)/(pression+recall)