一文读懂CRNN(基于图像序列识别的端到端可训练网络)

1.网络特点

1.端到段训练
2.自动处理变长序列
3.兼容基于词典与无词典模式

2.目前存在问题

1.对于序列识别,传统深度卷积DCNN输出长度固定,不能用于变长序列预测
2.变长识别问题可以使用检测+DCNN分类解决,但这种方法对于检测器有较高要求
3.基于词典的模式网络输出类别数量巨大,且难以范化到其他检测中去(例如中文,乐符OCR任务,新的任务需要新的词典)
4.存在方法:Hog feature+RNN,Hog feature无法端到段训练,RNN推理只依赖历史信息且存储的历史信息有限。

3.网络结构

CRNN网络结合了DCNN与RNN,网络由三部分组成
1.DCNN卷积
网络结构基于VGG并去掉全连接,第三四池化层使用1*2大小的池化窗口改变输出特征感受野以适配单词尺寸。用于提取输入图片特征到二维特征序列,每列特征与原始图片在水平方向上依次对应
在这里插入图片描述

2.循环层
使用Bi-LSTM构建特征序列,解决RNN上下文存储限制,解决LSTM只依赖过去信息的问题
在这里插入图片描述

3.转述层
转换每帧预测到标签序列,步骤

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值