一文读懂CRNN（基于图像序列识别的端到端可训练网络）

最新推荐文章于 2024-07-01 21:08:53 发布

码大哥

最新推荐文章于 2024-07-01 21:08:53 发布

阅读量1.9k

点赞数 1

文章标签：深度学习神经网络自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pleadge/article/details/126417998

版权

1.网络特点

1.端到段训练
2.自动处理变长序列
3.兼容基于词典与无词典模式

2.目前存在问题

1.对于序列识别，传统深度卷积DCNN输出长度固定，不能用于变长序列预测
2.变长识别问题可以使用检测+DCNN分类解决，但这种方法对于检测器有较高要求
3.基于词典的模式网络输出类别数量巨大，且难以范化到其他检测中去（例如中文，乐符OCR任务，新的任务需要新的词典）
4.存在方法：Hog feature+RNN，Hog feature无法端到段训练，RNN推理只依赖历史信息且存储的历史信息有限。

3.网络结构

CRNN网络结合了DCNN与RNN，网络由三部分组成
1.DCNN卷积
网络结构基于VGG并去掉全连接，第三四池化层使用1*2大小的池化窗口改变输出特征感受野以适配单词尺寸。用于提取输入图片特征到二维特征序列，每列特征与原始图片在水平方向上依次对应
在这里插入图片描述

2.循环层
使用Bi-LSTM构建特征序列，解决RNN上下文存储限制，解决LSTM只依赖过去信息的问题
在这里插入图片描述

3.转述层
转换每帧预测到标签序列，步骤

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
一文读懂CRNN（基于图像序列识别的端到端可训练网络）

CRNN网络介绍
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。