AI9-文本识别

最新推荐文章于 2024-08-06 21:32:10 发布

Qt学视觉

最新推荐文章于 2024-08-06 21:32:10 发布

阅读量27

点赞数

分类专栏： AI 文章标签：大数据人工智能数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013480226/article/details/140927692

版权

AI 专栏收录该内容

10 篇文章 0 订阅 ¥199.90 ¥299.90

订阅专栏

超级会员免费看

本章主要介绍文本识别算法的理论知识，包括背景介绍、算法分类和部分经典论文思路。

通过本章的学习，你可以掌握：

1. 文本识别的目标

2. 文本识别算法的分类

3. 各类算法的典型思想

1 背景介绍

文本识别是OCR（Optical Character Recognition）的一个子任务，其任务为识别一个固定区域的文本内容。在OCR的两阶段方法里，它接在文本检测后面，将图像信息转换为文字信息。

具体地，模型输入一张定位好的文本行，由模型预测出图片中的文字内容和置信度，可视化结果如下图所示：

文本识别的应用场景很多，有文档识别、路标识别、车牌识别、工业编号识别等等，根据实际场景可以把文本识别任务分为两个大类：**规则文本识别**和**不规则文本识别**。

* 规则文本识别：主要指印刷字体、扫描文本等，认为文本大致处在水平线位置

* 不规则文本识别：往往出现在自然场景中，且由于文本曲率、方向、变形等方面差异巨大，文字往往不在水平位置，存在弯曲、遮挡、模糊等问题。

下图展示的是 IC15 和 IC13 的数据样式，它们分别代表了不规则文本和规则文本。可以看出不规则文本往往存在扭曲、模糊、字体差异大等

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
AI9-文本识别

文本识别
复制链接

扫一扫

专栏目录

Qt学视觉 CSDN认证博客专家 CSDN认证企业博客

码龄11年

99: 原创

7329: 周排名

2万+: 总排名

14万+: 访问

: 等级

1257: 积分

1186: 粉丝

370: 获赞

16: 评论

189: 收藏

私信

关注

热门文章

分类专栏

OpenCV 付费 87篇
AI 付费 10篇

最新评论

相机校准和3D重建2-相机标定原理1
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
特征提取与检测2-Shi-Tomasi角点检测
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)提升标题与正文的相关性。
图片Qt程序中高级显示源码分享
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
OpenCV访问图片像素的三种方法
CSDN-Ada助手: 如何使用OpenCV进行立体视觉处理，例如深度感知和3D重建？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Qt学视觉 你的鼓励将是我创作的最大动力、

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。