Python技巧-只用一行代码轻松实现图片文本识别

最新推荐文章于 2024-08-12 10:27:56 发布

程序员的小傲娇

最新推荐文章于 2024-08-12 10:27:56 发布

阅读量424

点赞数

分类专栏： Python 文章标签： python 文本识别代码库编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoxijinger/article/details/119569284

版权

Python 专栏收录该内容

167 篇文章 7 订阅

订阅专栏

本文介绍了如何使用Python结合pytesseract和PIL库进行图片文本识别，特别强调了需要安装tesseract-ocr引擎和中文语言包，并提供了配置路径的教程。通过简单代码示例，演示了识别中文文本的过程。

摘要由CSDN通过智能技术生成

生活中我们可能会遇到需要从图片上获取文本内容的情况，人工去核对的话非常头疼。今天小千就来教大家使用Python一行代码就能实现文本识别，下面来看看吧。

Python图片文本识别

这里我们需要用到两个库：pytesseract和PIL，同时我们还需要安装识别引擎tesseract-ocr

安装这两个包可以借助pip

pip install PIL

pip install pytesseract

然后我们还需要安装识别引擎tesseract-ocr和中文语言包，默认是不支持中文识别的，所以需要同学们额外安装一个中文语言包，网络上下载安装即可。

安装完成tesseract-ocr后，我们还需要做一下配置关联到Python中：

在你安装Python的文件夹中C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py文件，打开之后在里面添加下面的操作。

CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

#tesseract_cmd = ‘tesseract’

tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’

可以看到里面有一个路径就是你安装Tesseract-OCR的路径，注意不要填错了。

配置完成之后就可以使用它们了，代码如下，其中denggao.jpeg为图片，同学们替换成自己想要的图片即可。
在这里插入图片描述

好了同学们赶紧去自己试试吧。最后欢迎大家关注小千，后期分享更多Python技术知识。

本文来自千锋教育，转载请注明出处。

程序员的小傲娇

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。