Feature Enhancement Network: A Refined Scene Text Detector
介绍
这篇论文提出了一个精细化场景文本检测框架,使用提出的一个新的名为特征增强的网络,此框架可以直接生成边界框,并且是端到端可训练的。
本文做出的贡献有:
1.提出了一种新的特征增强(FEN)网络,提高了文本检测的召回率和准确率。
2.为了进一步提高文本精细化阶段检测的准确率,本文提出了一种自适应权重(adaptively weighted)的位置铭感ROI Pooling。
3.针对文本精细化检测阶段存在的不均衡问题提出了一种positives mining 策略来进行解决。
4.本文提出的方法在ICDAR2011和2013检测任务上到达了最好的性能
相关介绍
这篇论文的灵感是来自R-FCN(Dai et al.2016)这篇论文,不同于原来的R-FCN网络所做的工作,本文通过任务特殊性,低级和高级语义特征融合来改进网络,并且在文本检测上取得了优异的表现,还提出了积极挖掘策略和自适应权重的ROI Pooling,都提高了文本检测准确性。
方法介绍
下图是本论文所提出的FEN网络的整体框架。(这个图看得头晕,画得有点复杂了。)