回归论文,感谢刘发给我的最新论文。
CSIG文档图像分析与识别专委会 已有关于这篇论文的解读,直指核心,凝练简洁。
作为一个小白还是需要静下心来细读,尤其是基础部分。特做一个整理。
0、Abstract
小学作业批改时一项费时费力的教师日常工作,论文提出了一个算术习题批改系统(Arithmetical Exercise Checker AEC),对常见的小学算术习题进行检测,识别和评估。该任务具有三个难点:1、算术习题包含了印刷体和手写体文本,并具有特殊的算术模式(如多行,分数);2、手写体文本往往具有锯齿状的边界且各行文本缠乱在一起;3、算术习题的语义内容可能会出现算术错误,使得语义信息价值降低。针对这些问题,论文利用算术习题自身的三个特性:1)边界模糊;2)算术模式局部相关性;3)算术符号全局无关性。实验表明本系统对40种常见的小学算术习题具有93.72%正确性,线上系统已经日均处理7.5万个请求,面向超过百万用户提供服务。
1、Introduction
第一步提取公式,第二步识别公式并生成文本,第三步用数学模型判定正确性。
模糊边界会妨碍基于anchor机制的目标检测算法,例如流行的SSD,Faster-RCNN。
参考博文: