Python对旋转图片验证码的识别和破解(一)

Python对旋转图片验证码的识别和破解

本文主要使用python + selenium来破解旋转突破的验证码;其中用到numpy和OpenCV(CV2)来进行图片拼接,转换,遮罩,识别等,共分为三个部分:
在这里插入图片描述

(一)旋转图片的正确位置

旋转突破最难的在于如何计算旋转角度,我们不可能用人工智能的方式来自动识别图片摆正的位置,那么我们只能遍历可能出现的图片并保存。通常遍历有两种可能:

  1. HTML代码中有所有图片的链接或Base64图片数据
  2. 程序自动运行,抓取图片,分析图片的异同,然后手工调正

第一种方法

图片1的方法很简单,比如51fapiao开出的发票url,当需要下载或浏览发票时,会有一个验证码,这个验证随机出现滑动验证码或者旋转验证码,但检查其出现验证码的html时,发现它保存有所有正确验证码图片的url列表

# 使用正则表达式取出所有的正确图像的url
html = driver.page_source
url_list = re.findall(
    "\'(http[^\']+?\d+?\.(?:jpg|png))\'", html, re.S)
# 旋转图片通常是一个正方形,假设宽高分别为w,h(通常w = h)
# 为了识别的方便,需要将所有图像拼接到一起,形成一行图像(或1列图像)
n = len(url_list)
img_all = np.zeros((h, w*n), dtype=np.uint8)
n = 0
for img_url in url_list:
    try:
        # 下载图像并载入
        r = requests.get(img_url)
        img_tmp = cv2.imdecode(np.asarray(
            bytearray(r.content), dtype=np.uint8), cv2.IMREAD_COLOR)
    except:
        continu
  • 2
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值