学习笔记(1)SEED: Semantics Enhanced Encoder-Decoder Framework for Scene TextRecognition
论文作者提出了一个语义增强的编码器-解码器框架用来提高对低质量的场景文本识别的能力。语义信息既用于编码器模块的监督,也用于解码器模块的初始化。
启发:现有方法将文本识别任务局部定义为序列字符分类任务,但忽略了整个单词的全局信息。因此,这些方法可能难以处理低质量的图像,例如图像模糊、遮挡和不完整的字符。但是,人们可以通过考虑文本的全局信息来很好地处理这些低质量的案例。为了解决这个问题,作者提出了SEED的框架,并且在融入现有SOTA方法ASTER中,去验证实验想法。
框架图:
注:...
原创
2021-11-29 15:53:03 ·
2459 阅读 ·
0 评论