OCR常用识别算法综述

飞锡2024

于 2024-04-04 16:05:23 发布

阅读量412

点赞数 2

文章标签： ocr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38235865/article/details/137365710

版权

参考：https://aistudio.baidu.com/education/lessonvideo/3279888

语种：常用字符36与常用汉字6623，区别。
标注：文本型位置/单字符位置，后者标注成本大
挑战：场景文字识别：字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡
发展历程：两个阶段2015年前，后

在这里插入图片描述
数据集：

Synth90k,Synth Text
在这里插入图片描述
水平文本

（最后一个基本不用上）

在这里插入图片描述

识别方法：

传统方法：

在这里插入图片描述

在这里插入图片描述

GTC

文本不规则解决

TextScanner

NRTR
自注意力模型：
更适合长文本识别

SAR
1D变2D效果更好

在这里插入图片描述
语言信息、对其信息、视觉信息都有用上，就是会更慢一点

在这里插入图片描述
RobustScanner

在这里插入图片描述

CDistNet

在这里插入图片描述

并行注意力解码

在这里插入图片描述

visionLAN

小结：
在这里插入图片描述

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OCR常用识别算法综述

OCR常用识别算法综述
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。