AI实战：用DenseNet + CTC搭建中文OCR模型

szZack

于 2019-08-03 08:14:49 发布

阅读量1.1w

点赞数 4

分类专栏：自然语言处理深度学习图像识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zengNLP/article/details/98246763

版权

人工智能同时被 3 个专栏收录

110 篇文章 9 订阅

订阅专栏

94 篇文章 10 订阅

订阅专栏

自然语言处理

36 篇文章 8 订阅

订阅专栏

前言

前段时间，项目中的一个核心模块中需要中文OCR功能，走过弯路趟过坑，这里分享出来。

实战

常见网络架构
- cnn + blstm + ctc
- cnn + ctc
- crnn + self_attetion + ctc
- crnn + attetion + ctc

github上面测试的结果
- 地址：https://github.com/senlinuc/caffe_ocr
- 结果
经验分享

1、使用DenseNet + CTC 架构搭建模型，在500万+的数据集上面训练，准确率0.97

2、词典：使用GB2312 + 常见特殊字符 + 数字 + 英文

3、实际测试中，DenseNet + CTC 比带Attention架构的模型整体识别率要高比较多，带Attention架构的模型一是容易误识别，二是容易漏识别

4、平衡整体性能，优先选 DenseNet + CTC

5、DenseNet + CTC模型存在的问题：无法区分字形很相近的字，如“ _ ”和 “ - ”， y和v等。带Attention架构的模型在这块有较大的优势。

详细介绍：DenseNet—Dense卷积网络

参考git源码

CTPN + DenseNet + CTC ： https://github.com/YCG09/chinese_ocr
crnn_self_attetion ： https://github.com/koibiki/crnn_self_attetion
CRNN_Attention_OCR ： https://github.com/wushilian/CRNN_Attention_OCR_Chinese

关注

4
点赞
踩
43

收藏

觉得还不错? 一键收藏
打赏
56
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 56

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

szZack 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。