python实现自动登录某瓣，过拼图验证

最新推荐文章于 2024-05-16 15:49:29 发布

Kong_Sir

最新推荐文章于 2024-05-16 15:49:29 发布

阅读量459

点赞数

分类专栏： python 文章标签： python 自动化 selenium pillow

本文链接：https://blog.csdn.net/zo2k123/article/details/131893887

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、环境介绍：

系统：window11 python：3.8 selenium：4.5
其他模块需要：requests、pillow

二、说明

总体思路：
1、利用selenium功能进行模拟鼠标、键盘自动化操作。
2、利用pillow功能进行图片的修改（主要是图片像素）
3、利用requests模块进行打码平台请求
4、利用第三方打码平台的API请求获取缺口的坐标x值，即缺口偏移量
注：此代码可以直接复制使用，代码仍有很大优化空间，本代码仅做技术研究使用，产生任何纠纷与本人无关。

本次只实现单次登录，并且即使拼图验证成功，账号本身有安全风险仍需要扫码登录。这个情况非本文探讨内容。

可以通过opencv和pillow模块实现本地识别缺口偏移量，但需要进行大量测试和准确率验证，节省时间本次采用第三方API进行识别，非广告，也可使用其他第三方API，效果一样。

未严格按照标准python工程代码格式，比如采用入口代码是：if __name__ == __main__或者创建类的方式。

三、代码使用

使用须知

1、应该知道windows系统是否开启了缩放功能，滑块起始偏移量应根据具体的缩放倍数调整，不然可能出现滑块移动位置错误的问题。
2、需要获取背景图url，通过url下载的图片往往偏大，所以使用pillow的函数调整为图片元素属性设置的大小后再计算偏移量。
3、代码中用户名和密码需要自己修改。
4、部分函数方法不接受浮点数据，出现浮点数需要转换成int
5、找不到元素，注意切换iframe，操作完还需要切换回去。
6、需要自己手动下载浏览器驱动。selenium 4.9版本后好像会自动下载驱动
7、代码使用的是chorme浏览器，绕过检测代码不一定所有版本都有效

代码

代码里面有详细解释

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support import expected_conditions as EC

import requests, json, base64, re, sys, time, os
from urllib.request import urlretrieve
from PIL import Image


def base64_api(img):
    # 图鉴官方提供的接口模板，这里稍微修改了下
    with open(img, 'rb') as f:
        b64 = base64.b64encode(f.read()).decode()

    data = {"username": "xxxx", "password": 'xxxxxx', "typeid": 33, "image": b64}

    result = json.loads(requests.post("http://api.ttshitu.com/predict", json=data).text)

    if result['success']:
        print(result)
        return result["data"]["result"]
    else:
        return result["message"]
    return ""

#获取验证图片，并调整像素
def get_bg_offset(url):
    src_png = r'.\download.png'
    resize_png = r'.\resize.png'

    #下载图片，和显示的图片大小不一样
    urlretrieve(url, src_png)

    # 打开原始图像
    image = Image.open(src_png)

    # 调整图像大小
    '''#经过元素属性查看，在页面显示的图片应该是278x198.571，resize方法不接受浮点数，
    Image.LANCZOS是改变图片大小的计算方式
    '''
    wide = 278
    high = 198.571
    resized_image = image.resize((int(wide), int(high)), Image.LANCZOS)
    # 保存修改后的图像
    resized_image.save(resize_png)
    return resize_png

#移动滑块
def move_slider(move_x,driver):
    '''
    计算滑块实际偏移量
    滑块每次起始大约离左边缘18.6个像素，这个是固定值,从元素属性中获知的。
    由于系统开启了缩放，扩大了1.5倍，故约为28个像素
    '''
    slider_x = move_x - 28
    print("鼠标移动量为：" + str(slider_x))

    #定位滑块元素
    slider_element = driver.find_element(By.XPATH,'//*[@id="tcOperation"]/div[6]')

    # 创建ActionChains对象
    actions = ActionChains(driver)

    #防止移动太快，被检测出来是自动化操作，移动多次。计算分两次移动的量
    temp = int(slider_x % 2)#取余，分两次移动可能还剩余1个像素
    slider_x /= 2

    # 按住并拖动元素,添加操作停顿时间，模拟人为操作，防止太快被判定为机器人操作
    actions.click_and_hold(slider_element).move_by_offset(int(slider_x), 0).perform()
    time.sleep(0.5)
    actions.click_and_hold(slider_element).move_by_offset(-55, 0).perform()#左移55个像素
    time.sleep(0.5)
    actions.click_and_hold(slider_element).move_by_offset(55, 0).perform()#右移55个像素
    time.sleep(0.5)
    actions.click_and_hold(slider_element).move_by_offset(int(slider_x)+temp, 0).perform()

    # 释放鼠标控制,这个是必须的，不然不进行最终验证
    actions.release().perform()

    # # 等待一段时间，可以根据需要调整等待时间
    # driver.implicitly_wait(2)
    return True


###--------------------------------------------------正式代码开始-----------------------------------------------------##
chrome_path = "./chromedriver.exe"
db_url = r"https://www.douban.com/"

driver = webdriver.Chrome(service=Service(chrome_path))

#绕过检测代码
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """
      Object.defineProperty(navigator, 'webdriver', {
        get: () => undefined
      })
    """
})

#打开网址
driver.get(db_url)

# 将网页最大化
driver.maximize_window()

time.sleep(1)

# 先切换到 iframe
wait = WebDriverWait(driver, 10)
iframe = wait.until(EC.frame_to_be_available_and_switch_to_it((By.XPATH, '//*[@id="anony-reg-new"]/div/div[1]/iframe')))

# 定位并点击密码登录元素
password_login_element = wait.until(EC.element_to_be_clickable((By.CLASS_NAME, "account-tab-account")))
password_login_element.click()

time.sleep(0.5)
driver.find_element(By.XPATH,'//*[@id="username"]').send_keys("xxxxxx")
driver.find_element(By.XPATH,'//*[@id="password"]').send_keys("xxxxxxx")
time.sleep(1)
driver.find_element(By.XPATH,'/html/body/div[1]/div[2]/div[1]/div[5]/a').click()#点击后会弹出滑快验证窗口

#切换到验证的iframe
iframe = wait.until(EC.frame_to_be_available_and_switch_to_it((By.XPATH, '//*[@id="tcaptcha_iframe_dy"]')))
time.sleep(1.5)
# 定位验证码图片的元素
captcha_element = driver.find_element(By.XPATH,'//*[@id="slideBg"]')

# 获取验证码图片的URL
captcha_image_url = captcha_element.get_attribute("style")
print("提取到背景图片的style内容:" + captcha_image_url)

# 使用正则表达式匹配图片元素属性中的URL
url_pattern = r'url\("([^"]+)\*\*?"\)'
match = re.search(url_pattern, captcha_image_url)

if match:
    # 提取括号里面的网址
    url = match.group(1)
    print("提取的网址：", url)
else:
    print("未找到匹配的网址！")
    sys.exit(1) 

#下载、调整图片
resize_png = get_bg_offset(url)

if not os.path.exists(resize_png):
    print(f"文件 '{resize_png}' 不存在！")
    sys.exit(1)
else:
    #通过打码平台得到偏移量，转换成数字
    move_x = float(base64_api(resize_png))
    print(f"背景图片空缺位置的起始x坐标为{move_x}")

#移动滑块move_x个像素
move_slider(move_x,driver)

# 切换回主文档
driver.switch_to.default_content()

#暂停程序的运行，控制台按任意键后退出程序，关闭浏览器
os.system("pause")
#退出浏览器
driver.quit()