论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network
主要是基于 Faster R-CNN. 根据文字检测场景的特点(水平排列),改进 RPN 网络、Anchors 和 Loss 函数. 关键点:
文本细尺度 proposals的检测(detecting text in fine-scale proposals);
递归地连接文本 proposals(recurrent connectionist text proposals);
侧边改进(side-refinement).
CTPN(Connectionist Text Proposal Network),end-to-end 框架:
类似于 Faster R-CNN,对 VGG16 网络输出(conv5)的卷积 feature map, 3×3 3 × 3 的窗口平滑(anchors 固定尺寸);
采用双向LSTM(Bi-directional LSTM, BLSTM)对每一行的序列窗口递归(recurrently)连接;其中,每个窗口的卷积特征(