传统的文字检测有3个思路:
(1) Character-based
(2) Word-based
(3) Text-line-based
TextBoxes: A Fast Text Detector with aSingle Deep Neural Network
是华中科技,白翔老师组的,AAAI2017,
论文主要是基于SSD做了以下的修改,
(1) 增加了default boxes,为了适应文字长度比较长,宽比较短的特性,增加了1,2,3,5,7,10这样的aspect ratios。
(2) 增加了Multi-scale的输入(300*300, 700*700,300*700, 500*700, and 1600*1600),结果比单一scale提高5个百分点。
整个检测流程就是SSD+NMS,识别流程使用的CRNN。
安装步骤:
git clone https://github.com/MhLiao/TextBoxes.git
cd TextBoxes
make all -j8
make pycaffe
python examples/demo.py
实际测试结果:
Reference:
https://github.com/MhLiao/TextBoxes
https://github.com/bgshih/crnn