四行Python代码，你也能从图片上识别文字！

最新推荐文章于 2023-12-11 10:24:04 发布

敲代码的灰太狼

最新推荐文章于 2023-12-11 10:24:04 发布

阅读量1.9k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tongtongjing1765/article/details/100581830

版权

图像识别、文字识别，这些都是现在比较火的东西，现在大部分的AI都有在做这些东西，那我们就过来了解一下吧！

只需要四行代码，完成从图片中读取图片中的文字！

准备工作：

我们需要两个安装包，先来安装一下：

pip install pillow

640?wx_fmt=png

pip install pytesseract

640?wx_fmt=png

安装完之后，我们需要下载Tesseract-OCR这个软件，这里我已经将东西都打包好了放在百度云中，大家可以直接下载：

链接：

https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA

密码：

npmn

打开安装包，一路next

640?wx_fmt=png

记录好自己的安装路径

640?wx_fmt=png

安装完之后找到tessdata目录下，将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

640?wx_fmt=png

之后，我们只剩下一个东西要配一下了，在pytesseract模块中的pytesseract.py文件中去配置一下Tesseract-OCR的工作目录，这个时候我们可以通过刚刚pip安装的位置找到pytesseract.py文件，如下图：

640?wx_fmt=png

进入目录找到pytesseract.py文件并且打开它：

640?wx_fmt=png

将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。

现在，我们在准备一张图片，用来识别，小编就用微信截图好了，放置在桌面文件夹上：

640?wx_fmt=png

开始代码：

到这里，我们所有的预备环境以及全部搭建好了，下面我们就开始来敲代码咯：

640?wx_fmt=png

from PIL import Image

import pytesseract

pic_content=pytesseract.image_to_string(Image.open('C:\\Users\\yuqing.wu\\Desktop\\all\\3.png'),lang='chi_sim')

print(pic_content)

我们来看看运行结果：

640?wx_fmt=png

结果还是比较准的。

大家也来试试吧！

像这样的图像识别还是挺重要、挺常用的，例如图片验证码等等，都是可以去完成的，就看大家怎么去用了！

640?wx_fmt=jpeg

感兴趣的扫个二维码吧！

敲代码的灰太狼

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
四行Python代码，你也能从图片上识别文字！

图像识别、文字识别，这些都是现在比较火的东西，现在大部分的AI都有在做这些东西，那我们就过来了解一下吧！只需要四行代码，完成从图片中读取图片中的文字！准备工作：我们需要...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。