attention 文字识别算法_图像文字识别(OCR)用什么算法小结

最新推荐文章于 2024-05-15 09:37:56 发布

GAMKER攻壳

最新推荐文章于 2024-05-15 09:37:56 发布

阅读量398

点赞数

文章标签： attention 文字识别算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36345268/article/details/111966118

版权

说明：主要考虑深度学习的方法，传统的方法不在考虑范围之内。

1.文字识别步骤

1.1detection：找到有文字的区域(proposal)。

1.2classification：识别区域中的文字。

2.文字检测

文字检测主要有两条线，两步法和一步法。

2.1两步法：faster-rcnn.

2.2一步法：yolo。相比于两步法，一步法速度更快，但是accuracy有损失。

文字检测按照文字的角度分。

2.1水平文字检测：四个自由度，类似于物体检测。水平文字检测比较好的算法是2016ECCV乔宇老师团队的CTPN。

2.2倾斜文字检测：文本框是不规则的四边形，八个自由度。倾斜文字检测个人比较喜欢的方法是2017CVPR的EAST和Seglink。套路：检测文本框－>用radon hough变换等方法进行文本矫正－>通过投影直方图分割出单行的文本的图片－>最后对单行OCR。

3.文字识别

只考虑了不需要对文字进行分割。

3.1定长的，各个字符之间看成是独立的：multi-digit number。

3.2不定长的：RNN/LSTM/GRU+CTC。白翔老师团队的CRNN写的比较清楚。

3.3不定长的attention-mechanism(CNN+RNN+Attention):分为hard attention(直接给出hard location，不能直接暴力pb)、soft attention(可以暴力pb)、gradient-base attention。

参考:https://www.zhihu.com/question/20191727

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
attention 文字识别算法_图像文字识别(OCR)用什么算法小结

说明：主要考虑深度学习的方法，传统的方法不在考虑范围之内。1.文字识别步骤1.1detection：找到有文字的区域(proposal)。1.2classification：识别区域中的文字。2.文字检测文字检测主要有两条线，两步法和一步法。2.1两步法：faster-rcnn.2.2一步法：yolo。相比于两步法，一步法速度更快，但是accuracy有损失。文字检测按照文字的角度分。2.1水平文...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。