AI实战:用DenseNet + CTC搭建中文OCR模型

前言

前段时间,项目中的一个核心模块中需要中文OCR功能,走过弯路趟过坑,这里分享出来。


实战

  • 常见网络架构
    • cnn + blstm + ctc
    • cnn + ctc
    • crnn + self_attetion + ctc
    • crnn + attetion + ctc

  • github上面测试的结果

  • 经验分享

    1、使用DenseNet + CTC 架构搭建模型,在500万+的数据集上面训练,准确率0.97

    2、词典:使用GB2312 + 常见特殊字符 + 数字 + 英文

    3、实际测试中,DenseNet + CTC 比带Attention架构的模型整体识别率要高比较多,带Attention架构的模型一是容易误识别,二是容易漏识别

    4、平衡整体性能,优先选 DenseNet + CTC

    5、DenseNet + CTC模型存在的问题:无法区分字形很相近的字,如“ _ ”和 “ - ”, y和v等。带Attention架构的模型在这块有较大的优势。



参考git源码

评论 56
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

szZack

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值