自动登录 RPA 的进阶：滑块验证的巧妙实现

coding侠客

已于 2024-09-20 22:12:20 修改

阅读量1.1k

点赞数 12

分类专栏： AI+RPA系列文章标签： rpa 人工智能

于 2024-09-20 21:14:56 首次发布

本文链接：https://blog.csdn.net/weixin_45593273/article/details/142369766

版权

AI+RPA系列专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在RPA的众多应用场景的探索中，自动登录是一个至关重要的环节，它为后续的自动化操作奠定了基础。然而，当我们面对滑块验证这一常见的挑战时，常常会感到困惑和无从下手。本文就来分享自动登录RPA的进阶----滑块验证如何实现。

在分享自动登录RPA的进阶之前，我们先来了解一个工具包–ddddocr

一、ddddocr：验证码识别的利器

ddddocr是一个功能强大的验证码识别工具包，专门用于处理各种复杂的验证码，包括滑块验证码、文字点选、算术、字母、数字等类型。它基于深度学习技术，能够准确地识别图像中的滑块位置，并提供相应的操作指令。

二、使用ddddocr实现滑块验证

在先前的探索中，如《揭秘AI+RPA：CSDN热榜数据抓取RPA与AI融合之道-CSDN博客》和《揭秘AI+RPA：CSDN 自动登录 RPA 的实现之道-CSDN博客》的所述，我们可以成功获取到谷歌浏览器的客户端。

    option = ChromiumOptions().set_paths(
        local_port=port
    ).set_argument('--start-maximized')
    client = ChromiumPage(addr_or_opts=option, timeout=10)

本文以知乎账号密码登录时的滑块验证为例，展示如何利用 ddddocr 来攻克这一难题。

1. 寻找拖拽的iframe标签

首先，我们需要在页面中找到拖拽滑块的 iframe 标签，这是后续操作的基础。

	iframe = client.get_frame(1)
	sleep(1)

2. 获取完整图片

接下来，获取包含滑块背景的完整图片。通过定位完整图片的元素，并获取其图片的 URL，然后使用 requests 库获取图片数据。

	image_ele = iframe.ele('@id:yidun_bg-img')
    image_url = image_ele.attr('src')
    response = requests.get(image_url)
    if response.status_code == 200:
        image_data = response.content
    else:
    	raise Exception('Failed to retrieve the image')

3. 获取缺口图片

和2一样的方法，获取带有缺口的图片数据。

	gap_image_ele = iframe.ele('@id:yidun_jigsaw')
    gap_image_url = image_ele.attr('src')
    response = requests.get(image_url)
    if response.status_code == 200:
        gap_image_data = response.content
    else:
    	raise Exception('Failed to retrieve the gap image')

4. 利用ddddocr工具包计算缺口的位置

这里是很关键的一步，使用 ddddocr 工具包的强大功能来计算缺口的准确位置。

	slider_ocr = ddddocr.DdddOcr(det=True,show_ad=False)
	slider_ocr.slide_match(gap_image_data, image_data)
	target = result.get('target')

让我们来分析一下slide_match方法，在我们的例子中，走的是else分支，所以simple_target对象先忽略。
该方法中有两个核心方法cv2.matchTemplate和cv2.minMaxLoc，cv2.matchTemplate使用了相关系数归一化方法进行目标图像和背景图像的匹配，而cv2.minMaxLoc方法用于在cv2.matchTemplate方法匹配的结果中获取最小、最大匹配值以及位置。

    def slide_match(self, target_bytes: bytes = None, background_bytes: bytes = None, simple_target: bool = False,
                    flag: bool = False):
        if not simple_target:
            ……
        # 会走else
        else:
            target = cv2.imdecode(np.frombuffer(target_bytes, np.uint8), cv2.IMREAD_ANYCOLOR)
            target_y = 0
            target_x = 0

        background = cv2.imdecode(np.frombuffer(background_bytes, np.uint8), cv2.IMREAD_ANYCOLOR)

        background = cv2.Canny(background, 100, 200)
        target = cv2.Canny(target, 100, 200)

        background = cv2.cvtColor(background, cv2.COLOR_GRAY2RGB)
        target = cv2.cvtColor(target, cv2.COLOR_GRAY2RGB)

        # 核心方法1，使用相关系数归一化方法进行目标图像和背景图像的匹配。
        # res是一个二维数组，大小与背景图像大小一致，每个位置表示目标图像在该位置与背景图像的匹配程度，范围是(-1, 1)
        res = cv2.matchTemplate(background, target, cv2.TM_CCOEFF_NORMED)

		# 核心方法2，通过minMaxLoc获取最小、最大匹配值以及位置
        min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
        h, w = target.shape[:2]
		# 图像坐标系，通常以左上角为原点，向右为 x 轴正方向，向下为 y 轴正方向。
        bottom_right = (max_loc[0] + w, max_loc[1] + h)
        return {"target_y": target_y,
                "target": [int(max_loc[0]), int(max_loc[1]), int(bottom_right[0]), int(bottom_right[1])]}

5. 计算滑块滑动的轨迹

由slide_match方法可知，target是一个对象。target的key对应的value是一个list，分别对应最大匹配位置的坐标，以及从该坐标开始的h * w的区域的右下角的坐标。即背景图像缺失的图像的x轴的坐标点为target[0]。

有了target[0]，我们就可以利用高中物理学到的匀加速运动的位移公式和速度公式，计算出滑动从起点到target[0]滑动的轨迹点。

让我们先来回顾下高中物理中的这些公式

速度公式
$v = v_0 + at$
其中是v末速度，是v0是初速度，a是加速度，t是时间。
位移公式
$v_0t + \frac{1}{2}at^2$
其中s是位移。

以下是公式的代码实现。

    v, t, acc_dis = 0, 0.5, 0
    plus = []
    while acc_dis < distance:
        if acc_dis < mid:
            a = round(random.uniform(1.0, 2.0), 1)
        else:
            a = -round(random.uniform(1.0, 2.0), 1)
        s = v * t + 0.5 * a * (t ** 2)
        v = v + a * t
        acc_dis += s
        plus.append(round(s))

6. 让RPA模拟人的动作，移动滑块到指定位置

最后一步，让 RPA 模拟人类的动作，将滑块移动到指定位置。

	move_btn = iframe.ele('@class:yidun_control')
    iframe.actions.hold(move_btn)
    for track in plus:
        iframe.actions.move(
            offset_x=track,
            # y轴的偏移，可以指定随机值
            offset_y=round(random.uniform(1, 10), 0),
            duration=0.1
        )
    time.sleep(0.1)
    iframe.actions.release(move_btn)