python实现图片扫描手把手教学(解决中文不能识别成功)

在使用python进行图片扫描前需要先下载一个Tesseract OCR

第一种方法可以进官网去下载https://digi.bib.uni-mannheim.de/tesseract/

在这里下载只需要找到合适你电脑环境的版本就行

我是win11系统下载的是最后一个版本

下载完后安装直接一路到底就行了

我们再去cmd下载两个python库

pip install pytesseract
pip install PIL

这时候如果你扫描的图片中不存在中文字体的话,基本就差不多做完准备工作了,但是如果你的需要扫描的图片中存在中文,就需要下载一个中文包,当然博主是个好人,现在双手奉上语言包(里面不止包含了中文)

https://pan.baidu.com/s/1S_Jffe8duiz1IdXhAZJawg

提取码为gg66(懂的都懂)

解压完语言包后打开语言包找到下面这个小东西

将这个小东西粘贴到位于你下载路径内的tessdata文件夹内

到这里基本就做完工作了,是不是很细?是不是手把手?

接下来开始操作

浅浅的调用以下两个大哥库

import pytesseract
from PIL import Image

这里需要注意一下其他博主教的都需要去进行环境配置,我就不,我就不配,环境配置这种东西,做不来,现在教你们直接不做环境配置直接用代码实现

# 显式指定 Tesseract 的安装路径
pytesseract.pytesseract.tesseract_cmd = r'I:\tesseract\tesseract.exe'
#这里的安装路径改成你们自己的就好了

接下来导入图片

#这里没什么好说的直接去复制你的图片地址就好了
img = Image.open(r'')

最后一步实现图片扫描

# 使用 pytesseract 进行文字识别
text = pytesseract.image_to_string(img, lang='chi_sim')  # 指定中文简体语言参数
#在这里值得说的是你要是需要扫描的图片内有中文,就需要去指定这个中文包,也就是下载好的语言包

劈里啪啦的讲一堆废话,现在给直接拉到底的小伙伴全部代码

import pytesseract
from PIL import Image
# 显式指定 Tesseract 的安装路径
pytesseract.pytesseract.tesseract_cmd = r'I:\tesseract\tesseract.exe'
# 打开图片
img = Image.open(r'')
# 使用 pytesseract 进行文字识别
text = pytesseract.image_to_string(img, lang='chi_sim')  # 指定中文简体语言参数
# 输出识别结果
print(text)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值