OCR知识框架构建(文本检测、文本识别、End2End)(更新中)

文本检测篇

1、基于分割的文本检测

PSENet(psenet解读 - 知乎

2、基于回归的文本检测

CTPN (场景文字检测—CTPN原理与实现 - 知乎)

文本识别篇

1、CRNN+CTC

详解CTC - 知乎

理解 LSTM 网络 - 简书

深度学习CV岗位面试问题总结(OCR篇)_小菜的博客-CSDN博客_opencv面试题

【OCR技术系列之七】端到端不定长文字识别CRNN算法详解 - Madcola - 博客园

2、CRNN+Attention (Attention机制简单总结 - 知乎, 权重计算方式)

3、CRNN+ACE

解码方式不同而已

4、CNN+Seq2seq+Attention (im2latex)

5、CRNN+Seq2seq+Attention

End2End篇

1、Deep TextSpotter

2、Mask TextSpotter v1-v3

结论

1. 实践对比:相同测试样本的情况下

    crnn+ctc 推理速度 平均15ms 

    crnn+attention 推理速度 平均60ms

2. 公式识别 推理速度

文本识别参考资料:

OCR文本识别之ACE loss论文解读(better than CTC,attention???) - 知乎

三年磨一剑——微信OCR图片文字提取

OCR文字识别—基于CTC/Attention/ACE的三大解码算法 - 知乎

https://github.com/bityigoss/mtl-text-recognition

万阳春:度小满金融OCR技术在小微场景中的应用

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值