OCR--秒懂文字检测CTPN(CNN+LSTM) 二

简介

CTPN是在ECCV 2016提出的一种文字检测算法。CTPN结合CNNLSTM深度网络,能有效的检测出复杂场景的横向分布的文字,效果如下图,是目前比较好的文字检测算法。
在这里插入图片描述
如下图所示,左面为传统RPN预测的框,右面为CTPN的框。由于RPN中anchor感受野的问题,不可能有一个anchor可以像传统的人车物检测那样覆盖了整行的文本。

在这里插入图片描述

CTPN

网络结构

CTPN结构与Faster R-CNN基本类似,但是加入了LSTM层。

CTPN 使用到了 CNN 和 双向LSTM 的网络结构:

  • CNN使用了VGG16进行图像的特征提取。
  • 双向LSTM对序列各元素前后的联系进行学习。
  • 最后为一个全连接层输出要预测的参数
    在这里插入图片描述

N:images
首先VGG16提取特征,获得大小为
N ∗ C ∗ W ∗ H N*C*W*H NCWH 的conv5 feature map。之后在conv5上做3*3的滑动窗口,即每个点都结合周围 3 ∗ 3 3*3 33区域特征获得一个长度为 3 ∗ 3 ∗ C 3*3*C 33C的特征向量。输出 N

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值