python获取滑块验证码需要滑动的距离

我们以这个网站为例: http://120.86.191.138/hbgs/zwgk/dirData.do?dirId=402881204e959150014e959f42f30014&subjectId=93e889f2501d3fe8015024305bdf0efc
往后点到第四页后会出现验证码

一.获取到背景图片和缺口图片

在这里插入图片描述
我们发现图片是base64格式通过API直接发送

二.识别缺口位置输出x距离

img_data = base64.b64decode(img_data)  # png
img_btn_data = base64.b64decode(img_btn_data)  # png
# 读取图片
img = Image.open(io.BytesIO(img_data))
img_btn = Image.open(io.BytesIO(img_btn_data))
# 识别缺口
left = identify_gap(img, img_btn, bg_params, gp_params)[0]
print(left)

identify_gap.py

import cv2
import numpy as np


def identify_gap(background, gap, bg_edge_list: list[int], gp_edge_list: list[int]):
    """
    获取缺口的X坐标

    使用OpenCV的边缘检测实现

    :param background: 背景图片对象
    :param gap: 缺口图片对象
        图片对象可以是cv2.imread('opencv_logo.jpg',0)
        也可以是PIL.Image.open('opencv_logo.jpg')
    :param bg_edge_list: 背景图片对比度调整参数[50, 100] 50为最小对比度,100为最大对比度
    :param gp_edge_list:缺口图片对比度调整参数[50, 100] 50为最小对比度,100为最大对比度
    :return:
    """

    background_image = background  # 背景图片
    background_image = np.array(background_image)
    gap_image = gap  # 缺口图片
    gap_image = np.array(gap_image)
    # 识别图片边缘
    background_edge = cv2.Canny(background_image, bg_edge_list[0], bg_edge_list[1])
    gap_edge = cv2.Canny(gap_image, gp_edge_list[0], gp_edge_list[1])

    # 转换图片格式
    background_picture = cv2.cvtColor(background_edge, cv2.COLOR_GRAY2RGB)

    gap_picture = cv2.cvtColor(gap_edge, cv2.COLOR_GRAY2RGB)

    res = cv2.matchTemplate(background_picture, gap_picture, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)  # type: ignore

    return max_loc

3.完整代码

import base64
import io
import re
import requests
from PIL import Image
from packages.scrapy_spiders.utils.captcha.compare_image import identify_gap
def getlist_cookie(yzm_res):
    """
    获取验证码返回的set-cookie并返回
    :param response:
    :return dic:
    """
    extracted_cookies = {}
    cookies = yzm_res.headers["Set-Cookie"].split(",")
    # 解析Set-Cookie头部中的cookies
    for cookie in cookies:
        parts = cookie.split(";")[0].split("=")
        if len(parts) == 2:
            key, value = parts
            extracted_cookies[key.strip()] = value.strip()
    return extracted_cookies
def generate_random_string():
    htmlurl='http://120.86.191.138/hbgs/verify/index.do'
    response = requests.get(htmlurl).text
    # 编写正则表达式来匹配verify后的值,注意这里我们使用了转义字符来匹配冒号和单引号
    pattern = r"verify\s*:\s*'([^']*)'"

    # 使用re.search查找匹配项
    match = re.search(pattern, response)

    # 如果找到匹配项,则提取括号内的内容(即需要的值)
    if match:
        value = match.group(1)
        print("提取的verify值为:", value)
    else:
        print("未找到匹配的verify值")
        return None

    return value

ssst=generate_random_string()

yzm_url=f'http://120.86.191.138/hbgs/verify/get_img_verify.do?verify={ssst}'
res=requests.get(yzm_url)
cookies = getlist_cookie(res)
res=res.json()
bg_params = [100, 200]
gp_params = [100, 200]
img_data=res["oriCopyImage"]
img_btn_data=res["newImage"]
img_data = base64.b64decode(img_data)  # jpg
img_btn_data = base64.b64decode(img_btn_data)  # png
# 读取图片
img = Image.open(io.BytesIO(img_data))
img_btn = Image.open(io.BytesIO(img_btn_data))
# 识别缺口
left = identify_gap(img, img_btn, bg_params, gp_params)[0]
print(left)

dataurl='http://120.86.191.138/hbgs/verify/check.do'
header={
'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8'
}
formdata=f'verify={ssst}&IY={res["Y"]}&X={left}&Y={res["Y"]}'

res2=requests.post(dataurl, formdata,cookies=cookies,headers=header).json()
print(res2)
itemurl='http://120.86.191.138/hbgs/zwgk/item.do'
formdata=f'page=6&rows=20&HBTB_XH=&HBTB_XH_END=&HBTB_XMMC=&HBTB_SPWH=&HBTB_TXDZ=&HBTB_GSSJ=&HBTB_GSSJ_END=&dirId=402881204e959150014e95bb85b5010f&subjectId=93e889f2501d3fe8015024305bdf0efc&backPage=&vcode={res2["data"]}'

res=requests.post(itemurl, formdata)
print(res.text)
### 回答1: Python可以使用第三方库Selenium来处理滑块验证码。Selenium是一个自动化测试工具,可以模拟浏览器的行为。我们可以用它来模拟用户操作,例如拖动滑块。 处理滑块验证码的步骤如下: 1. 首先安装Selenium库,可以使用pip命令进行安装:pip install selenium 2. 导入Selenium库:from selenium import webdriver 3. 创建一个浏览器对象,推荐使用Chrome浏览器:browser = webdriver.Chrome() 4. 打开网页,使用get方法打开验证码页面:browser.get("滑块验证码网页的URL") 5. 定位滑块和背景图片的元素,通过id、class或者其他属性进行定位,例如:slider = browser.find_element_by_xpath("//div[@class='slider']")、background = browser.find_element_by_xpath("//div[@class='background']") 6. 获取滑块和背景图片的位置信息,可以使用元素的属性获取:slider_location = slider.location、background_location = background.location 7. 计算滑块需要移动的距离,一般是滑块的位置减去背景图片的位置,例如:distance = slider_location['x'] - background_location['x'] 8. 导入ActionChains库:from selenium.webdriver.common.action_chains import ActionChains 9. 使用ActionChains库中的drag_and_drop_by_offset方法来拖动滑块,将距离作为参数,例如:ActionChains(browser).drag_and_drop_by_offset(slider, distance, 0).perform() 10. 提交表单,完成滑块验证,例如:submit_button = browser.find_element_by_xpath("//input[@type='submit']")、submit_button.click() 通过以上步骤,可以使用Python的Selenium库来处理滑块验证码需要注意的是,由于每个滑块验证码的实现方式可能不同,上述步骤可能需要根据具体的情况进行调整和优化。 ### 回答2: Python 可以使用 Selenium 库来处理滑块验证码。以下是一个简单的示例代码: ```python from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains # 创建 Chrome 浏览器实例 driver = webdriver.Chrome() # 打开目标网站 driver.get("目标网站的URL") # 定位滑块滑动区域元素 slider = driver.find_element_by_xpath("滑块元素的XPath") slider_area = driver.find_element_by_xpath("滑动区域元素的XPath") # 获取滑块的初始位置和滑动区域的宽度 initial_position = slider.location['x'] slider_width = slider_area.size['width'] # 计算需要滑动距离,这里可以根据具体情况来调整 target_position = initial_position + slider_width * 0.8 # 创建 ActionChains 对象并执行滑动动作 action = ActionChains(driver) action.click_and_hold(slider).move_by_offset(target_position, 0).release().perform() # 若需要等待滑块验证结果的加载完成,则可以添加等待代码,例如等待某个元素的出现 # 关闭浏览器实例 driver.quit() ``` 以上代码仅提供了一个基本的处理滑块验证码的框架,具体应用时可以根据实际情况进行调整和扩展。如有需要,可以参考 Selenium 文档进行更深入的学习和使用。 ### 回答3: Python可以使用selenium库与浏览器进行交互,以处理滑块验证码。下面是一种可能的解决方法: 1. 导入selenium库和相应的浏览器驱动程序。例如,如果使用Chrome浏览器,需要下载ChromeDriver并将其路径配置到系统环境变量中。 2. 使用selenium库打开目标网页,并找到滑块验证码的图片和滑块元素。 3. 使用selenium库的`get_attribute()`方法获取滑块验证码的图片的URL,并使用`requests`库下载保存到本地。 4. 使用OpenCV库读取滑块验证码图片,并使用图像处理技术分割滑块背景和滑块。 5. 将滑块背景图像与目标块的图像进行比对,找出滑块相对于滑块背景图像的偏移量。 6. 使用selenium库的`ActionChains`类,模拟鼠标点击并拖动滑块元素,将滑块拖动到正确的位置。 7. 使用`selenium`库的`execute_script()`方法执行JavaScript代码,模拟鼠标释放,完成验证码的拖动。 8. 验证验证码是否通过,可以通过判断页面元素是否发生变化或者出现登录成功的提示进行判断。 需要注意的是,滑块验证码的设计可能不同,因此具体的处理方法可能会有所不同。以上是一种简单的处理滑块验证码的方法,具体的实现还需要根据实际情况进行调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我把把C

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值