Python+Requests对图片验证码的处理

Requests对图片验证码的处理

在web端的登录接口经常会有图片验证码的输入,而且每次登录时图片验证码都是随机的;当通过request做接口登录的时候要对图片验证码进行识别出图片中的字段,然后再登录接口中使用;

通过request对图片验证码的识别方法(带有噪点的图片)
一、通过在本地安装OcrServer工具识别图片验证码

百度下载ocrserver工具

如下图:解压后双击OcrServer.exe;然后电脑的右下角会显示该服务的IP和端口

二、通过python编写脚本,并配合OcrServer工具,识别出图片验证码的值

前置条件:导入需要的插件

import base64
import request

1、发送图片验证码的接口,返回图片的响应后保存到指定文件夹

获取验证码图片,并保存下来为123.png
response = requests.get('获取验证码图片的URL地址')
img = response.content
with open('../sample/123.png','wb') as f:
    f.write(img)

2、打开并读取图片后,通过base64对图片进行编码

# 读取图片后,通过base64对图片进行编码
png = open('123.png','rb')
res = png.read()
s = base64.b64encode(res)
png.close()
# print(s.decode('ascii'))

3、在本地打开OcrServer.exe插件后,发送编码后的图片到指定的url地址,返回值为json格式

# 在本地打开OcrServer.exe插件后,发送编码后的图片到指定的url地址,返回值为json格式:{"code":"验证码图片的值"}
response = requests.post(url="http://127.0.0.1:12349",data=s)
code_num = response.json()
print(code_num['code'])

4、查看识别的验证码图片的值

获取到的验证码图片如下图

 代码执行后输出的结果如下图

 全部代码如下图示例:可写成一个封装类,用来调用

import base64
import requests

# 获取验证码图片,并保存下来为123.png
response = requests.get('获取图片验证码的url地址')
img = response.content
with open('../sample/123.png','wb') as f:
    f.write(img)

# 读取图片后,通过base64对图片进行编码
png = open('123.png','rb')
res = png.read()
s = base64.b64encode(res)
png.close()
# print(s.decode('ascii'))

# 在本地打开OcrServer.exe插件后,发送编码后的图片到指定的url地址,返回值为json格式{“code”:"验证码图片的值"}
response = requests.post(url="http://127.0.0.1:12349",data=s)
code_num = response.json()
print(code_num['code'])

通过编写python代码,导入第三方库(),识别图片验证码(没有噪点的图片)

 没有噪点的图片;如下图:

纯数字:下面代码的图片名称以为666.png代替

纯中文:下面代码的图片名称以为999.png代替

 1、首先下载 Pillow库和 pytesseract库,用来识别图片验证码

pip install Pillow
pip install pytesseract

2、通过导入第三方库,然后编写如下代码识别图片验证码;

示例代码:下面以纯数字的图片验证码举例

from PIL import Image
import pytesseract

# pytesseract和PIL只能对图片验证码没有噪点的识别成功
path = '666.png'
captcha = Image.open(path)
result = pytesseract.image_to_string(captcha,lang="chi_sim")
print(result)

执行结果:识别成功

 示例代码:下面以纯中文的图片验证码举例

from PIL import Image
import pytesseract

# pytesseract和PIL只能对图片验证码没有噪点的识别成功
path = '999.png'
captcha = Image.open(path)
result = pytesseract.image_to_string(captcha,lang="chi_sim")
print(result)

执行结果:识别成功

获取验证码图片的URL地址

 

总结:

感谢每一个认真阅读我文章的人!!!

作为一位过来人也是希望大家少走一些弯路,如果你不想再体验一次学习时找不到资料,没人解答问题,坚持几天便放弃的感受的话,在这里我给大家分享一些自动化测试的学习资源,希望能给你前进的路上带来帮助。

软件测试面试文档

我们学习必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

 

          视频文档获取方式:
这份文档和视频资料,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!以上均可以分享,点下方小卡片即可自行领取。

  • 18
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
自动化处理滑动验证码(也称为滑块验证或移动验证码)在Python中通常涉及到使用图像处理和机器学习技术,尤其是OCR(Optical Character Recognition,光学字符识别)以及一些专门针对这类挑战设计的库,如OpenCV、PIL、Tesseract OCR等。以下是一个简单的概述: 1. 图像获取:首先,使用Python的Selenium库或其他类似工具模拟浏览器行为,获取带有滑动验证码的页面。 2. 图像预处理:对滑动验证码图片进行灰度处理、二值化、去噪,以便更好地提取验证码中的关键信息。 3. 物体检测:利用图像识别技术(如滑块边缘检测、特征点提取),定位滑块和目标字符的位置。 4. 特征提取:对于滑块,可能需要提取其运动方向或角度;对于字符,可能提取轮廓或局部纹理特征。 5. OCR识别:使用OCR引擎(如Tesseract),识别滑块上的提示文字,这可能包含上下文信息,帮助确定正确的位置。 6. 操作模拟:根据识别的结果,指示模拟器移动滑块到正确位置,或者直接提供相对位置信息给模拟器。 7. 验证码输入:将识别到的目标字符输入到相应的表单字段中。 8. 重复过程:如果滑动验证码有变化,可能需要循环上述步骤,直到通过验证。 需要注意的是,许多网站会频繁更新验证码策略,以应对自动化工具,所以这个过程可能需要定期更新算法以适应新的验证码形式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值