简要翻译论文:Filtering segmentation cuts for digit string recognition

以下翻译仅代表个人理解,不对的地方欢迎大家指正,仅仅作为本人学习过程中的随笔.

感谢E. Vellasques等作者所作出的贡献

2008年E. Vellasques等作者发表在Pattern Recognition<<Filtering segmentation cuts for digit string recognition>>
1.摘要
在本文中,我们提出了一种方法来评估分割手写手写数字。这种方法的思想是在基于分割的识别系统中作为滤波器。
这种系统通常依赖于过分割方法,其中为每个接触数字组创建几个分割假设,然后通过一个通用的分类器进行评估。
所提出的方法的新颖之处在于,使用通用分类器而不需要进行任何分类尝试,就可以识别不必要的分割假设,从而减少分割的路径数,从而降低了计算成本。
采用基于成本的ROC方法来优化滤波器。实验结果表明,该滤波器可以消除多达83%的不必要的分割假设,提高系统的整体性能。

2.Verification versus filtering
文献8中的方法:识别+验证(图3描述完整系统)
为了更好地评估滤波器的影响,使用了文献〔8〕中提出的手写识别系统。该系统采用基于过分割的启发式识别系统,其中分类器和验证器是众所周知的多层感知器(MLP)。
该方法将来自不同级别的输出(如分割、识别和后处理)组合在概率模型中,用于推断最后结果。有关该系统的完整描述,请参阅参考文献〔8〕。
从图3可以看出,这个系统是基于两个平行的分类模型。前者是通用分类器(10类),是由132个分量的特征向量和轮廓信息训练得到MLP。
后者是一个验证器,用来检测过分割。也是一个MLP。它使用一个由42个特征组成的称为MCA的特征向量(多级别凹面分析)。使用这样的验证器的是由于分类MLP不足以处理这些错误分割。
本文方法:过滤+识别(图4示出滤波策略)
但是,在本文工作中使用的不是验证,而是基于过滤。与具有并行分类模型不同,该方法由过滤器和识别器顺序组合。这个概念是由兰德贝等人在文献[13]中提出的,
在我们的工作中,第一阶段分类器是一种用来区分必要的分割点和不必要的分割点的滤波器,而第二级分类器是被训练来识别10类数字的通用分类器。
如果在使用通用分类器(10类)之前先检测过分割,就可以降低计算成本。为了实现这样的目标,使用ROC的cost-based的方法来优化滤波器。
我们将通过综合实验证明,这种策略可以显著减少对通用分类器的调用次数,同时提高识别器的性能。

3.Implementation
如前所述,该方法的目的是对单笔或多笔粘连数字串的分割进行分类。由于分割点的位置与其适应度之间没有关系,因此避免了使用结构特征。
在文献〔8〕中已经证明,从分割假设中提取判别信息是非常困难的。我们解决这个问题的方法是,不要试图理解什么可以使一个点被认为是必要或不必要的,而是试图找出分割切分是否导致了过度分割。
在这种方式中,滤波器被用来区分孤立的数字与过分割的片段。在图5中可以看到这两个类的一个例子。
即对于手写识别系统来说,错过必要的切割比正确识别不必要的切割更糟糕。在本节的剩余部分中,我们描述了用于训练过滤器的特征集,并介绍了ROC和成本分析的概念。

3.1Feature set
使用在文献8中提出Feature set(MCA)区分孤立数字和过分割碎片.
提取如下:
首先,过分割假设部分和原始粘连数字的每个背景像素都必须用该像素拥有的前景邻居(考虑上下左右4个方向)的数目进行标记。这是该像素的初始凹面级别(ICL)。ICL的一个例子可以在图6中看到。
Iseg和Iorig分别表示标记过的分割假设后的分割部分之一和标记过的原始粘连图像.在标记完之后,对它们的ICL进行像素级比较。比较的结果,会创建一个新的标记过的图像(MCA)。
比较Iseg和Iorig的每个像素,如果它们具有不同的标签,则在MCA中对应位置分配特定标签,指示凹度发生了变化。否则,将分配相同的标签。来自ISEG的前景像素也在MCA图像对应前景位置获得特定的标签。
在创建MCA后,提取过分割假设部分的上下文信息(CI)。ISEG的CI是在原始标记图像中对应ISEG部分的上方和下方区域的ICL,包括所有可能的前景像素。在图7中可以看到MCA的两个例子。

从给定图像中提取七个MCA特征:由两个黑色像素包围的背景像素的数目、由三个黑色像素包围的背景像素的数目、由四个黑色像素包围的背景像素的数目(但不在闭环内)、背景像素的数目在闭环中,经历标签变化的背景像素的数目、MCA区域内的前景像素的数目、以及MCA区域外但在扩展区域内的前景像素的数目。

划分区域方案用于提取这些特征。在创建MCA标签图像后,将图像划分为2×3个区域。从每个区域提取七个MCA特征。所有区域的特征向量被连接成一个具有42个特征的单一特征向量。对于每个分割后的一部分,都会提取这样一个特征向量。
使用此方案的原因是,与正确分割的数字相比,过分割部分在其凹度级别上通常不会遭受比较大的变化。此外,过分割部分的凹度级别的变化在不同位置比正确分段数字的变化更容易发生,使用分区方案可以捕捉这种行为。

3.2ROC-based cost scheme
简述ROC,完整内容参考文献14.ROC主要用来评估分类器输出品质,它能够很好的描述分类器对于不均衡分布的样本的分类性能。ROC曲线将Y轴定义为TPR(True Positive Rate),X轴定义为FPR(False Positive Rate)。这表示ROC曲线上左上角的点是分类器追求的理想点,即高TPR,低的FPR。虽然存在(1,0)配置的点不太现实,但是ROC曲线下方面积越大往往对应着较好的分类效果。ROC曲线一般用于二分类的分类器中。为了将ROC曲线或区域拓展到多类别(标签)分类中,需要将输出进行二值化。一条ROC曲线可以描绘一种分类(标签),但是也可以考虑每个标签元素的微平均来描绘ROC曲线。多分类问题的另一种评估方法是宏平均,方法是给每个标签相同的权重。

4. Experiments with Chen and Wang's algorithm
实验使用15000个粘连图像(5000训练,10000测试)和10000个孤立数字训练.粘连数字从文献7中提取,文献7包含273452的粘连图像(由NIST SD19中2000个孤立数字合成).这个数据集非常合适该实验,因为它有真值,例如最优分割位置.
因为要实验在性能和计算成本两方面的贡献,所以采用文献17中提出的TVF(total-number of value features)作为评价指标,见公式5.
4.1Experiments with Fenrich's algorithm(18)
4.2Experiments with Chen and Wang's algorithm(3)


5.Discussion and conclusion
尽管有一定效果,但还是有需要改善之处,滤波器的主要缺点是与最佳点相似的分割点的检测有关。也就是,如果一个分割路径不需要,但是它能正确分割数字,滤波器会认为它是必要分割.图18展示了尽管0和3被正确分割,但是分割路径并不是最优路径.为了解决这个缺点,需要给滤波器添加上下文信息,例如,如果几个路径都被认为是必要的,则只保留概率最高的那一个.这个可能会缓解滤波器在文献3(Chen and Wang's algorithm)算法上出现的问题.
所提出的滤波器在两种不同的分割算法上进行了测试。第一种是相当快的,并且对于不同的粘连类型表现良好。第二个是更复杂的,但它不能以实际的形式应用于实际应用。本文的目的是论证滤波器的效率,同时也讨论滤波器的局限性。
虽然实验是在两位数的字符串中进行的,但是MCA特征的使用使得该方法能够扩展到任何长度的字符串,因为识别数字字符串中过分段的数字的过程既不与字符串长度有关,也不与分段剪切的数量有关。

 

 

 

 

 

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值