Python技巧-只用一行代码轻松实现图片文本识别

本文介绍了如何使用Python结合pytesseract和PIL库进行图片文本识别,特别强调了需要安装tesseract-ocr引擎和中文语言包,并提供了配置路径的教程。通过简单代码示例,演示了识别中文文本的过程。
摘要由CSDN通过智能技术生成

生活中我们可能会遇到需要从图片上获取文本内容的情况,人工去核对的话非常头疼。今天小千就来教大家使用Python一行代码就能实现文本识别,下面来看看吧。

Python图片文本识别

这里我们需要用到两个库:pytesseract和PIL,同时我们还需要安装识别引擎tesseract-ocr

安装这两个包可以借助pip

pip install PIL

pip install pytesseract

然后我们还需要安装识别引擎tesseract-ocr和中文语言包,默认是不支持中文识别的,所以需要同学们额外安装一个中文语言包,网络上下载安装即可。

安装完成tesseract-ocr后,我们还需要做一下配置关联到Python中:

在你安装Python的文件夹中C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py文件,打开之后在里面添加下面的操作。

CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

#tesseract_cmd = ‘tesseract’

tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’

可以看到里面有一个路径就是你安装Tesseract-OCR的路径,注意不要填错了。

配置完成之后就可以使用它们了,代码如下,其中denggao.jpeg为图片,同学们替换成自己想要的图片即可。
在这里插入图片描述
在这里插入图片描述

好了同学们赶紧去自己试试吧。最后欢迎大家关注小千,后期分享更多Python技术知识。

本文来自千锋教育,转载请注明出处。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值