使用selenium+OpenCV破解极验滑动/滑块验证码

本文详细介绍了如何使用selenium配合OpenCV技术来识别并模拟滑动极验验证码的过程,包括加载stealth脚本以避免被识别为机器人,以及通过matchTemplate函数计算滑块位置。最后提到通过延迟释放滑块策略来通过验证的技巧。
摘要由CSDN通过智能技术生成

使用selenium+OpenCV破解极验滑动/滑块验证码

本文主要讲解如何使用selenium+OpenCV来破解极验滑动验证码,主要步骤如下:

  1. 使用selenium打开目标网页,获取验证码背景图片和滑块图片
  2. 使用OpenCV来识别滑块的位置并计算滑动的距离
  3. 使用selenium模拟鼠标拖动滑块,完成验证

实现效果

请添加图片描述

主要难点

极验验证码会检测当前浏览器环境,如果发现是自动化脚本控制的浏览器,则验证将失败。

自动化脚本控制的浏览器都具有一些特征,网站可以通过检测这些特征来识别非正常访问。
不过这些特征可以通过一些特殊的技术进行隐藏伪装,比如puppeteer-extra-plugin-stealth插件中提供的stealth.min.js脚本。
我们可以配置selenium在加载网页之前先加载stealth.min.js脚本,这样就可以绕过网页自身的检测机制。

def open_browser(url: str) -> webdriver.Chrome:
    """打开浏览器并导航到指定网址"""
    print('打开验证码页面...')
    # 创建一个Chrome浏览器实例
    browser = webdriver.Chrome()
    # 在加载页面之前先加载stealth.min.js,防止被识别为机器人访问
    with open('stealth.min.js', 'r') as f:
        js = f.read()
    browser.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js})
    # 打开指定网址
    browser.get(url)
    return browser

识别滑块的位置

使用OpenCV的matchTemplate函数可以比较两张图片的相似度,从而找到滑块的位置。

def compute_slide_offset(bg_canvas_content, slide_canvas_content):
    """根据背景图片和滑块图片计算滑块位置,并返回需要滑动的距离。"""
    bg_img = cv2.imdecode(np.frombuffer(base64.b64decode(bg_canvas_content), np.uint8), cv2.IMREAD_UNCHANGED)
    tp_img, tp_bounding_box = crop_slider(slide_canvas_content) # 裁剪掉滑块图片的透明背景,只留下滑块本身

    # 识别图片边缘
    bg_edge = cv2.Canny(bg_img, 100, 200)
    tp_edge = cv2.Canny(tp_img, 100, 200)

    # 转换图片格式
    bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
    tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)

    # 缺口匹配
    res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)  # 寻找最优匹配
    return max_loc[0] - tp_bounding_box[0]

识别效果:

背景图:

请添加图片描述

滑块图:

请添加图片描述

识别结果:

请添加图片描述

绿框是滑块初始位置,红框是识别需要拖动到的滑块位置,这两个位置之间的水平位移就是滑动的距离。

模拟人类拖动滑块

直接拖动滑块将被极验识别为机器人操作,本来想通过采集人类轨迹然后构建轨迹库来模拟人类操作,后来发现在拖动滑块后延迟两秒释放滑块就可以通过验证,
看来极验对轨迹的验证还是有漏洞的。

def slide(slide_offset):
    """拖动滑块"""
    print('拖动滑块...')
    wait = WebDriverWait(browser, 1800)
    element = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,
                                                         'body > div.geetest_fullpage_click.geetest_float.geetest_wind.geetest_slide3 > div.geetest_fullpage_click_wrap > div.geetest_fullpage_click_box > div > div.geetest_wrap > div.geetest_slider.geetest_ready > div.geetest_slider_button')))
    actions = ActionChains(browser, duration=2000)  # 拖动不能太快,不然验证会失败
    actions.drag_and_drop_by_offset(element, slide_offset, 0)
    actions.perform()

项目源码

下载地址:https://download.csdn.net/download/AppRen/88865702

备注

本项目仅作为技术交流使用,禁止用于非法用途。

  • 10
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值