人工智能学习--文本识别实践-tesseract-ocr

最新推荐文章于 2024-07-24 15:36:57 发布

Robot-G

最新推荐文章于 2024-07-24 15:36:57 发布

阅读量552

点赞数

分类专栏：人工智能文章标签：文本学习文本识别文本识别实验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GGY1102/article/details/115095515

版权

人工智能专栏收录该内容

18 篇文章 2 订阅

订阅专栏

前提假设：

1. 所要检测的图片是纯文本或者文字，最好是只有一行；或者截图只有一行文本的图片。如下图

图片名称： text03.jpg

2. 从文本检测（深度学习网络）软件检测到的包含文本区域的图片。

开源文本识别软件（OCR）

Tesseract-OCR

下载链接：https://digi.bib.uni-mannheim.de/tesseract/

可以根据自己的电脑操作系统位数决定下载32位或者 64位，按照时间顺序，可以下载最新的版本。

安装步骤：

下载完后，是 .exe格式文件，点击安装，一直下一步就可以了。

注释：如果有提示：选择下载包（在additional language data (download 下选择中数学公式库和中文库Chinese（simplified）（traditional）），两者都选上，点击“next”继续

注释：如果选中additional的√ 钩号，安装时可能提示一个错误，不管它，直接按 enter 键盘按键，直到装完。

笔者是装在 E:| 盘，，，目录是E:\ Tesseract-OCR

环境配置：

1. 将Tesseract-OCR安装目录（E:\Tesseract-OCR）加入环境变量path中；环境变量获取方式：右键桌面上的 “计算机”图标，然后如下图所示。双击 PATH 在最末尾加入刚刚软件安装的目录。

2 新建环境变量，变量名TESSDATA_PREFIX 并赋值为E:\Tesseract-OCR\tessdata

运行方法：

Windows的 cmd命令行模式下运行，如下图红色框里，可以正确检测前面 text.jpg 图片里的英文内容。

tesseract 是命令

第一个目录是要识别的图片目录和文件名

第二个目录是结果要保存的目录和文件名

-l 是选项符号，（-后面那个小写字母是L的小写）

eng 是English的缩写，在目录 E:\Tesseract-OCR\tessdata目录下，完整名称是下图的红色框内 eng.traineddata文件名。

makebox是固定的写法

注释：如果想要检测中文文字的图片，则需要下载 chi_sim.traineddata文件，下载地址：https://github.com/tesseract-ocr/tessdata

注释：如果以上GitHub打不开可以试试，CSDN的加速计划 https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

运行结果：

运行结果是一个 .box 文件，可以用文本类编辑工具软件打开或记事本打开查看内容

结果是一行一个字母，如果图像比较干净，无干扰背景纹理的话，检测准确率很高。

Python 版本，没测试：可以参考：

https://zhuanlan.zhihu.com/p/113961004

https://blog.csdn.net/qq_41030861/article/details/99842001?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

总结：

用于简单的图片，例如白底黑字，一行或者多行文字，字符直接比较松散，则检测结果质量较高，准确率较高。

若，图片中背景颜色很杂很多干扰因素，或者黑底白粗字，或者倾斜或者其他门牌号广告牌等大字体，艺术字体，则几乎无法正确识别。想要识别这些场景下的文字，则需要用深度学习神经网络模型，网上有很多开源软件，需要GPU伺候。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。