第五种:Python使用内置库pytesseract实现图片验证码的识别

一.安装Tesseract模块

1.Git文档地址:https://digi.bib.uni-mannheim.de/tesseract/
2.百度网盘下载地址:https://pan.baidu.com/s/16RoJ19WynWOKI4Zpr0bKzA
提取码:5hst     

二.配置环境变量

1.编辑系统变量里面path,添加下面的安装路径:D:\Program Files\Tesseract-OCR(填写自己的实际安装路径)

三.安装python的第三方库

#一个python的图像处理库,pytesseract依赖
pip install pillow 
pip install pytesseract
1.修改pytesseract.py文件,指定tesseract.exe安装路径

2.编辑pytesseract.py文件(此步骤必须做,否则运行代码时会报错)
tesseract_cmd = 'D:\Program Files\Tesseract-OCR'

在这里插入图片描述

四.代码实现

import requests
from PIL import Image
import pytesseract

# 验证码地址
url = "http://cloud.xxxx.com/checkCode?0.7337270680854053"
response = requests.get(url).content
print(response)

# 将图片写入文件
with open('test.png','wb') as f:
    f.write(response)
    
# 识别验证码
# 第一步:通过内置模块PIL打开文件
image = Image.open('test.png')

#转化为灰度图
image = image.convert('L')  

#设定的二值化阈值
threshold = 160   

#table是设定的列表
# for循环一个规则,小于阈值的,就设定为0,大于阈值的,就设定为1          
table = []                  
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)

#对灰度图进行二值化处理,按照table的规则(也就是上面的for循环)
image = image.point(table,'1')  
image.show()

#对去噪后的图片进行识别
result = pytesseract.image_to_string(image) 
print('图片内容为:',result)
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

平头哥-测试

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值