Character Region Awareness for Text Detection
字符区域注意的文本检测
介绍:
可选择的,字符级的关注对于解决弯曲文本有许多好处,通过一个自底向上的方式连接字符。大部分文本数据集没有提供字符级的注释,而获取字符级的注释代价十分昂贵。
本文中提出了一个新颖的文本检测其定位单个字符区域,并将检测的字符连接成一个文本实例。
卷积神经网络 产生 字符区域得分 和关联得分。字符区域得分用于定位独立字符,关联的分将字符组成一个实例。
提出了一个弱监督框架,在现有的单词级的数据集上估计字符级的ground truths。
相关工作:
基于回归的文本检测器: TextBoxes DMPNet RSDD
基于分割的文本检测器: Multi-scale FCN,Holistic-prediction PixelLink SSTD TextSnake
端到端文本检测器:FOTS EAA MaskSpotter 识别模型有助于检测器更好的应对背景混乱。
大多数方法以单词为单位检测文本。单词的边界不能被严格定义,词语的注释模糊了ground truth的含义。
字符级的文本检测器:MSER,Seglink,Mask TextSpotter
灵感来源于WordSup,是一个弱监督架构用于训练字符级的文本检测器,然而一个劣势是WordSup中的字符表示是矩形框,容易受到透视形变的影响。且受主干架构的性能影响(使用SSD,anchor box的数量和大小被限制)。
方法:
我们方法的主要目的是在图像中准确地定位每一个字符。为此,我们训练了一个深度神经网络来预测字符区域和字符之间的关联。因为目前没有公开的字符级别的数据集,这个模型
CRAFT阅读笔记
最新推荐文章于 2023-12-25 09:57:25 发布