一、简介
上图是抖音最新的旋转验证码,和老款旋转验证码相比,现在新增了很多防御措施,比如内圈小图增加了白色花边,内外圈图片颜色有一定差异等等。所以给我们识别增加了很大难度。
二、免费识别方法介绍
经过我们大量的数据标注,我们终于完成了这款验证码的角度识别。我们可以完成原图、截图两种识别方式,并且正确率可以达到99%左右。我们封装成了接口,大家可以在这里免费测试识别效果:得塔云
大家可以根据下图所示,点击在线获取图片,然后得到图片,最后点击识别
识别效果如下,下面就会看到图片矫正效果,因为实际旋转是中间小图顺时针旋转,外圈大图是逆时针旋转,所以下图识别的69度就是小图顺时针旋转69度,外圈大图是逆时针旋转69度的结果。
三、识别代码
1、原图识别
原图识别是指通过网站上图片链接直接下载的图片,具有固定的图片尺寸,大图347×347、小图211×211,如下图所示
python识别代码如下
import base64
import requests
import datetime
import numpy as np
from io import BytesIO
from PIL import Image
t1 = datetime.datetime.now()
#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
img_format = img.format
if img_format == None:
img_format = 'JPEG'
format_str = 'JPEG'
if 'png' == img_format.lower():
format_str = 'PNG'
if 'gif' == img_format.lower():
format_str = 'gif'
if img.mode == "P":
img = img.convert('RGB')
if img.mode == "RGBA":
format_str = 'PNG'
img_format = 'PNG'
output_buffer = BytesIO()
# img.save(output_buffer, format=format_str)
img.save(output_buffer, quality=100, format=format_str)
byte_data = output_buffer.getvalue()
base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)
return base64_str
# 旋转图片
def rotate_img(img, angle):
# 转换为有alpha层
temp_img2 = img.convert('RGBA')
# 旋转
rot = temp_img2.rotate(-angle)
# 创建一个与旋转图像大小相同的白色图像
fff = Image.new('RGBA', rot.size, (255, 255, 255, 0))
# 使用alpha层的rot作为掩码创建一个复合图像
out = Image.composite(rot, fff, rot)
# 将临时图片转换为元素图片颜色模式
temp_img2 = out.convert(img.mode)
return temp_img2
# 加载外圈大图
img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-1.png')
# 图片转base64
img1_base64 = PIL_base64(img1)
# 加载内圈小图
img2 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-2.png')
# 图片转base64
img2_base64 = PIL_base64(img2)
# 验证码识别接口
url = "https://www.detayun.cn/openapi/verify_code_identify/"
data = {
# 用户的key
"key":"EI4vT8UGFTXRE4hZR7cE",
# 验证码类型
"verify_idf_id":"58",
# 外圈大图
"img1":img1_base64,
# 内圈小图
"img2":img2_base64,
}
header = {"Content-Type": "application/json"}
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)
# 获取响应数据,识别结果
print(response.text)
print("耗时:", datetime.datetime.now() - t1)
angle = response.json()['data']['angle']
# 使用crop方法裁剪图片
s_img = img2
b_img = img1
# 旋转图片
b_img = rotate_img(b_img, -angle)
s_img = rotate_img(s_img, angle)
# 将小图粘贴到大图的中心
b_img.paste(s_img, (70, 70))
b_img.show()
运行上面代码,可以直接看到识别后的拼接效果图
2、截图识别
截图识别对图片有一定的要求,必须是对圆形图片切边截取,截取下来应该是一个正方形。如果切边截图不标准,可能会影响到识别正确率。
切边截取样例图如下,比如如下图蓝线所示,与圆形外切:
python识别代码如下:
import base64
import requests
import datetime
import numpy as np
from io import BytesIO
from PIL import Image
t1 = datetime.datetime.now()
#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
img_format = img.format
if img_format == None:
img_format = 'JPEG'
format_str = 'JPEG'
if 'png' == img_format.lower():
format_str = 'PNG'
if 'gif' == img_format.lower():
format_str = 'gif'
if img.mode == "P":
img = img.convert('RGB')
if img.mode == "RGBA":
format_str = 'PNG'
img_format = 'PNG'
output_buffer = BytesIO()
# img.save(output_buffer, format=format_str)
img.save(output_buffer, quality=100, format=format_str)
byte_data = output_buffer.getvalue()
base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)
return base64_str
# 旋转图片
def rotate_img(img, angle):
# 转换为有alpha层
temp_img2 = img.convert('RGBA')
# 旋转
rot = temp_img2.rotate(-angle)
# 创建一个与旋转图像大小相同的白色图像
fff = Image.new('RGBA', rot.size, (255, 255, 255, 0))
# 使用alpha层的rot作为掩码创建一个复合图像
out = Image.composite(rot, fff, rot)
# 将临时图片转换为元素图片颜色模式
temp_img2 = out.convert(img.mode)
return temp_img2
# 加载外圈大图
img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-5.jpg')
# 图片转base64
img1_base64 = PIL_base64(img1)
# 验证码识别接口
url = "https://www.detayun.cn/openapi/verify_code_identify/"
data = {
# 用户的key
"key":"EI4vT8UGFTXRE4hZR7cE",
# 验证码类型
"verify_idf_id":"58",
# 外圈大图
"img1":img1_base64,
# 内圈小图
"img2":"", # 这里必须设置为空字符串
}
header = {
"Content-Type": "application/json"
}
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)
# 获取响应数据,识别结果
print(response.text)
print("耗时:", datetime.datetime.now() - t1)
angle = response.json()['data']['angle']
width, height = img1.size
# 判断图片的形状是否是300x300
if width != 300 or height != 300:
# 如果不是,则调整图片大小到300x300
img = img1.resize((300, 300), Image.ANTIALIAS) # 注意:应该是 Image.ANTIALIAS 或 Image.ANTIALIASED
# 定义裁剪区域(左上角坐标,宽度,高度)
# 这里的坐标和尺寸都是基于像素的
crop_rectangle = (55, 55, 245, 245) # 例如:(100, 100, 400, 400) 表示从(100, 100)开始裁剪,宽度和高度都是300像素
# 使用crop方法裁剪图片
s_img = img.crop(crop_rectangle)
b_img = img
# 旋转图片
b_img = rotate_img(b_img, -angle)
s_img = rotate_img(s_img, angle)
# 将小图粘贴到大图的中心
b_img.paste(s_img, (55, 55))
b_img.show()
想了解更多验证码识别,请访问:得塔云