OCR——CRNN

一、研究背景

1、photoOCR (CNN)请添加图片描述2、Reading Text in the Wild with convolutional Neural Networks(CNN)
detection+recogntion请添加图片描述
3、A Novel Connectionist(RNN)
请添加图片描述
4、word spottting(空间映射)
请添加图片描述
5、CRNN优点
(1)支持端到端训练
(2)支持任意长度字符序列识别,且不需要自符分割、水平尺度归一化
(3)支持无预定义字典识别,且在预定义词典、无预定义词典上都取得显著性能
(4)模型更轻量级
请添加图片描述

二、网络结构

(一)CNN(序列特征提取)

请添加图片描述
请添加图片描述

(二)RNN(Bi-LSTM:字符预测输出)

1、RNN(前提还要)

请添加图片描述
在这里插入图片描述
RNN存在梯度消失/爆炸问题

2、LSTM(增加记忆细胞)

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

3、双向LSTM(增加记忆细胞)

请添加图片描述
y1向量大小为n_class*1

(三)Transcription转入 layers(训练:实现输出御图像标签对齐)

1、CTC

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述请添加图片描述
请添加图片描述
请添加图片描述请添加图片描述
请添加图片描述

(四)Beam Search(预测)

保留top(n)
请添加图片描述
请添加图片描述

四、总结

请添加图片描述
请添加图片描述

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值