验证码识别

1:引入pytesseract
2:下载安装Tesseract-OCR 引擎
链接:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01dev-20170510.exe
3:需要配置环境变量(测试发现,不配置环境变量也可以出结果)
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract-OCR\Tesseract-OCR(这是基于我安装的Tesseract-OCR 引擎地址写的)
4:到python安装文件下找到 site-packages/pytesseract/pytesseract.py 修改里面内容:
tesseract_cmd = 'D:/Tesseract-OCR/Tesseract-OCR/tesseract.exe'
这个EXE文件也要要改成你自己的安装目录
5:如果你不想配置这些环境变量的话,你可以在python代码文件里面写上这两句代码
pytesseract.pytesseract.tesseract_cmd = 'D:/Tesseract-OCR/Tesseract-OCR/tesseract.exe'
tessdata_dir_config = '--tessdata-dir "D:/Tesseract-OCR/Tesseract-OCR/tessdata"'
(当然了,这地址也是基于你自己的安装目录)
6:找个图片进行识别测试
import pytesseract
from PIL import Image
img = Image.open('da4554c01a8c0563bf7fc106c3934722s.png')
# print(img)
#config参数:任何其它配置为字符串(官方文档是这样解释的)
(在自如中的价格雪碧图是需要加这个参数才可以把读出字符串的)
s = pytesseract.image_to_string(img,config='--psm 6')
print(s)

 

 

转载于:https://www.cnblogs.com/wts-home/p/9992849.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值