【Paper Reading】【CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network】

abstract:

  • 在卷积特征图中用一系列fine-scale text proposals来直接检测文本行
  • 垂直anchor机制,同时预测每一个固定宽度proposal的位置和文本/非文本分数
  • 使用RNN,以获取上下文信息来提高检测正确率
  • multi-scale and multi-language text reliable,无需额外后处理

introduction:

  • motivation:
    • 深度CNN在目标检测上的发展,如Faster Region-CNN(R-CNN,提出RPN,从卷积特征图直接生成高质量的无类别目标proposals)
    • 目标检测与文本行检测的区别:
      • 一般目标具有大致轮廓/中心点
      • 文本行没有相对固定的长度
  • contribution:
    • 将文本检测问题转化为fine-scale text proposals序列的定位问题。提出垂直anchor机制,同时预测每一个固定宽度proposal的位置和文本/非文本分数。
    • 提出in-network recurrence mechanism,连接卷积特征图中的sequential text proposals。
    • 将上述两个方法无缝整合,得到端到端可训练模型,一次操作可以处理多尺度多语言文本,避免的更多的后处理

details:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值