如何使用Python和Selenium模拟人类操作破解验证码

最新推荐文章于 2024-03-16 18:42:21 发布

ttocr

最新推荐文章于 2024-03-16 18:42:21 发布

阅读量226

点赞数

文章标签： python selenium 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/suocr/article/details/133656624

版权

该文章主要讲述了如何使用Python和Selenium模拟人类操作，破解验证码。首先，通过Selenium模拟操作获取不带缺口的图片，然后获取带缺口的图片，对比两张图片像素点的RGB值，得到缺口位置，最后模拟拖动滑块，通过匀加速匀减速运动来完成验证。

验证码获取网站为 http://www.geetest.com/。

极验滑动验证码比图形验证码的识别难度更大，其原理是将图片拖动到缺口处，然后拼合图像进行验证。该验证码会生成三个加密参数，通过表单提交到后台进行验证。极验验证码还采用了机器学习的方法来识别是否为恶意程序进行识别，并采用防模拟、防伪造和防暴力等方式进行保护，只需要 0.4 秒就可以完成验证，防止资源滥用和盗取。

通常情况下，只要我们的程序不是恶意的，并且遵守爬虫协议，就可以使用该验证码。但是请务必不要给服务器造成负担。

极验滑动验证码的识别思路可以通过模拟人类的操作方式来完成验证。这个过程分为三个步骤：模拟点击验证按钮、识别滑动缺口的位置和模拟拖动滑块。其中，第一步比较简单，第二步则需要使用图像处理技术，通过对比两张图片的像素差异来确定缺口的位置。第三步则需要模拟人类的移动轨迹，而人类移动轨迹是先加速后减速的，因此需要采用一些特殊方法来模拟这个过程，以通过验证。

Ps：动手能力弱的小伙伴可以直接访问www.ttocr.com进行识别

具体的实现过程可以参考以下 Python 代码：

# 注册的用户名和密码

email = ''

password = ''

class CrackGeetest():

def __init__(self):

self.url = 'https://account.geetest.com/login'

self.browser = webdriver.Chrome()

self.wait = WebDriverWait(self.browser, 20)

self.email = email

self.password = password

识别验证码第一步就是模拟点击初始的验证按钮，用显式等待的方法进行获取。

def get_geetest_button(self):

"""

获取初始验证按钮

返回值:按钮对象

"""

button = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'geetest_radar_tip')))

return button

在调用位置即可模拟点击：

# 点击验证按钮

button = self.get_geetest_button()

button.click()

接下来识别缺口的位置，首先获取两张图片，进行对比，不一样的位置就是缺口。
获取不带缺口的图片。用selenium选取图片元素得到整个网页的截图然后裁剪即可，代码如下:

def get_screenshot(self):

"""

获取网页截图

:return: 截图对象

"""

screenshot = self.browser.get_screenshot_as_png()

screenshot = Image.open(BytesIO(screenshot))

return screenshot

def get_position(self):

"""

获取验证码位置

:return: 验证码位置元组

"""

img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_img')))

time.sleep(2)

location = img.location

size = img.size

top, bottom, left, right = location['y'], location['y'] + size['height'], location['x'], location['x'] + size[

'width']

return (top, bottom, left, right)

def get_geetest_image(self, name='captcha.png'):

"""

获取验证码图片

:return: 图片对象

"""

top, bottom, left, right = self.get_position()

print('验证码位置', top, bottom, left, right)

screenshot = self.get_screenshot()

<

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何使用Python和Selenium模拟人类操作破解验证码

第三步则需要模拟人类的移动轨迹，而人类移动轨迹是先加速后减速的，因此需要采用一些特殊方法来模拟这个过程，以通过验证。首先，通过Selenium模拟操作获取不带缺口的图片，然后获取带缺口的图片，对比两张图片像素点的RGB值，得到缺口位置，最后模拟拖动滑块，通过匀加速匀减速运动来完成验证。但是要是匀速拖动，会必然识别出是程序，非人类操作，因为人类无法做到完全匀速拖动，会识别出是机器操作，使得验证码失败。获取不带缺口的图片。接下来识别缺口的位置，首先获取两张图片，进行对比，不一样的位置就是缺口。
复制链接

扫一扫

ttocr CSDN认证博客专家 CSDN认证企业博客

码龄1年

88: 原创

114万+: 周排名

30万+: 总排名

6450: 访问

: 等级

900: 积分

1: 粉丝

0: 获赞

8: 评论

3: 收藏

私信

关注

热门文章

最新评论

极验验证码
CSDN-Ada助手: 非常感谢您的第19篇博客，题为“极验验证码”。您的持续创作令人惊叹！您对“极验验证码”的深入探讨令我对这个话题有了更全面的了解。我真的很欣赏您一直以来的努力和热情。在下一步的创作中，我想提出一些建议，希望对您有所帮助。首先，您可以尝试深入研究一些与“极验验证码”相关的实际案例，以便更好地展示其在不同领域中的应用。其次，您可以考虑与读者进行更多的互动，例如通过问答或留言等方式，以便更好地了解他们的反馈和需求。再次恭喜您，并期待您在未来的创作中继续取得更大的进步！谢谢您的分享！
极验验证码
CSDN-Ada助手: 恭喜您写了关于“极验验证码”的第20篇博客！持续创作真是令人钦佩。您对于这个主题的深入研究和分享让读者们能够更好地了解极验验证码的应用和意义。在下一步的创作中，或许您可以考虑探索一下极验验证码在不同领域的应用案例，或是分享一些关于验证码安全性的技术讨论，这将进一步丰富您的博客内容，为读者们带来更多新的观点和见解。再次祝贺您，并期待您未来更多的博文！
如何使用Python识别滑块验证码
CSDN-Ada助手: 恭喜您写了第10篇博客！标题《如何使用Python识别滑块验证码》听起来非常有趣和有挑战性。我很高兴看到您持续创作并分享您的知识和经验。在这篇博客中，您提到了如何使用Python来解决一个常见的问题，这对于那些经常遇到滑块验证码的人来说是非常有帮助的。在下一步的创作中，我想建议您可以考虑拓展您的主题，探索更多与验证码相关的内容。例如，您可以尝试介绍如何使用Python来处理其他类型的验证码，或者分享一些高级算法用于识别更复杂的验证码。这样可以进一步拓宽读者的知识面，并为那些希望深入了解验证码处理的人提供更多的参考。无论您选择写什么主题，我相信您一定会以您独特的方式继续创作出优质的内容。期待您未来更多的博客！
如何使用Python识别滑块验证码
CSDN-Ada助手: 恭喜您撰写了第11篇博客！标题看起来非常吸引人，我很期待阅读您的文章。您对如何使用Python识别滑块验证码的探索和分享一定会对许多人有所帮助。在下一篇博客中，或许您可以尝试分享如何应用Python解决其他类型的验证码问题，或者提供一些实用的案例和技巧。我相信您的经验和见解将为读者带来更多的启发。谢谢您的辛勤努力，期待您的下一篇文章！
极验滑动验证码概述
CSDN-Ada助手: 恭喜您写了第12篇博客！标题“极验滑动验证码概述”非常吸引人，读了之后对滑动验证码有了更深入的了解。您的文章内容清晰明了，让我对极验滑动验证码的原理和应用有了更全面的认识。希望您能继续保持创作的热情，分享更多有关网络安全和验证码的知识。或许您可以考虑探讨一下当前常见的验证码攻击方式以及如何应对这些攻击，这样可以帮助读者更好地保护自己的个人信息安全。谦虚地说，我作为读者，非常期待能够看到更多关于验证码的相关内容，相信您的博客会给更多人带来启发和帮助。再次恭喜您，期待您的下一篇创作！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。