OCR算法

最新推荐文章于 2025-03-26 09:18:25 发布

吃饱饭好干活

最新推荐文章于 2025-03-26 09:18:25 发布

阅读量1.8k

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_42809268/article/details/127977390

版权

本文介绍了OCR领域的两种主要算法类型：两阶段算法和端到端算法，并详细列举了近年来在端到端规则文本识别及任意形状文本识别方面具有代表性的研究成果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

OCR算法可以分为两阶段算法和端到端的算法。两阶段OCR算法分为文本检测和识别算法，文本检测算法从图像中得到文本行的检测框，然后识别算法识别文本框中的内容。端对端OCR算法使用一个模型同时完成文字检测和文字识别，因此端对端模型更小，速度更快。
深度学习技术在端到端文本识别方向具有代表性的方法。这些方法大致可以分为两类：
1）端到端规则文本识别(平直文本或倾斜文本)；
2）端到端任意形状文本识别(弯曲、变形、平直、倾斜文本)。

类别	论文
端到端规则文本识别	FOTS（2018）、TextSpotter（2018）
端到端任意形状文本识别	Mask TextSpotterv1、Mask TextSpotter2（2019）、Mask TextSpotterv3、TextDragon（2019）、CharNet、TUTS、ABCNet、ABCNetV2（2021）、Text Perceptron、PGNet、PAN++（2021）

参考链接：
《动手学OCR》系列课程之：端到端算法