论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

这篇博客介绍了CTPN(Connectionist Text Proposal Network),一种改进自Faster R-CNN的文字检测方法。CTPN利用双向LSTM进行文本序列的递归连接,并通过侧边改进提升文本框的定位精度。它通过固定宽度的文本提案检测细尺度的文本,并使用多任务损失函数进行端到端训练。
摘要由CSDN通过智能技术生成

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

[Paper]

[Code-Caffe]

[Online Demo]

主要是基于 Faster R-CNN. 根据文字检测场景的特点(水平排列),改进 RPN 网络、Anchors 和 Loss 函数. 关键点:

文本细尺度 proposals的检测(detecting text in fine-scale proposals);

递归地连接文本 proposals(recurrent connectionist text proposals);

侧边改进(side-refinement).

CTPN(Connectionist Text Proposal Network),end-to-end 框架:

  • 类似于 Faster R-CNN,对 VGG16 网络输出(conv5)的卷积 feature map, 3×3 3 × 3 的窗口平滑(anchors 固定尺寸);

  • 采用双向LSTM(Bi-directional LSTM, BLSTM)对每一行的序列窗口递归(recurrently)连接;其中,每个窗口的卷积特征(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值