前言:一个公司的登录接口肯定是需要验证码的,但是现在为了防止自动化登录,攻击等一系列情况,所以返回的验证码不是纯数字,而是一个图片,图片上有数字或者是动态图片等之类的信息,但是想要从图片上直接把数字提取出来,设计的内容和第三方库,软件的应用比较多,自己现在没时间搞这些,所以自己就把服务端返回的data:image/png;base64这个类型的数据直接转化成图片,然后直接手动把验证码敲出来,有人会问,那这样做,我为什么不直接去页面去看验证码呢,理由如下:①:验证码返回除了图片的base64转码,往往还有有个验证码id ,并且这个id还要和图片对应起来才可以登录
类似于处理这样的验证码:直接通过pycharm运行python调用电脑的图片显示器直接显示出来
# 这个是获取验证码的接口
import requests
import base64
from PIL import Image
import io
import re
import time
session = requests.session()
timestamp = int(time.time())
# 获取验证码的全部返回值:借助了当前时间戳工具
def get_code():
resp = None
try:
headers = {"Accept": "application/json", "Content-Type": "application/json"}
url = f"url自己的url?date={timestamp}"
resp = session.get(url=url, headers=headers)
except Exception as e:
print("获取验证码失败:", e)
return resp
# 获取验证码图片,直接打印出来
def get_code_image():
"""
1:先把base64格式的图片验证码的base64编码部分的利用正则表达式提取出来,然后进行解码,然后进行读取图片并show展示
2:正则表达式:re.search表示正则匹配的第一个对象; r :用于对转义字符的处理 data:image/png;base64, :表示以这些固定数据开头 (.*)是匹配的表达式 .代表任意字符 *代表.代表的字符出现多次:.*表示任意长度的任意字符序列 match.group(1):从找到的数据提取第一组数据
"""
#下面具体的提取公式根据自己公司接口的返回值来确定自己提取下
base64_str = get_code().json().get("data").get("image")
match = re.search(r'data:image/png;base64,(.*)', base64_str)
decoded_bytes = base64.b64decode(match.group(1))
image = Image.open(io.BytesIO(decoded_bytes))
image.show()
time.sleep(3) # 等待3秒
image.close()
if __name__ == "__main__":
# print(get_code().json().get("data").get("captchaId"))
get_code_image()
一般返回的是'image': ',,,,,,,,,,,,,,,
在python编码的时候只需要用到iVBORw0KG,,,,,,,,,,,,,,, 所以就需要用正则表达式提取一下