论文标题:TextBoxes: A Fast Text Detector with a Single Deep Neural Network
作者:Minghui Liao, Baoguang Shi, Xiang Bai, Xinggang Wang, Wenyu Liu
Introduction
- 场景文字识别与传统OCR有区别,场景文字识别需要区别文字与背景的关系,同时光照条件也会影响识别效果。
- 传统的场景文字识别方法步骤多,很麻烦,TextBoxes提供了一种简单直接的神经网络来解决这个问题。
- TextBoxes能做到快速而准确的文字识别,可以同时输出文字所在的区域和置信度,并且设计了一些方法来解决识别不同比例的文字的问题。
- TextBoxes文字检测的结果直接输入到识别模块得出最终的识别结果,识别模块使用的是CRNN方法。
- 总的来说TextBoxes有以下几个优点:
- End-to-end trainabel neural network for scene text detection.
- Word spotting/end-to-end recognition framework that effectively combines detection and recognition.
- High competitive result and computational efficientlyd.
Related works
- 场景文字识别检测(Scene Text Reading)主要有两个任务,