如何使用Python和Selenium模拟人类操作破解验证码

最新推荐文章于 2024-11-05 19:36:08 发布

ttocr

最新推荐文章于 2024-11-05 19:36:08 发布

阅读量90

点赞数

文章标签： java git github 计算机视觉 opencv

本文链接：https://blog.csdn.net/suocr/article/details/133465328

版权

本文详细介绍了如何使用Python和Selenium模拟人类操作来破解极验滑动验证码。通过获取不带缺口和带缺口的图片，对比像素差异找到缺口位置，再模拟拖动滑块的匀加速匀减速运动来完成验证。具体步骤包括模拟点击验证按钮、识别缺口位置和模拟拖动。提供了一段Python代码作为实现过程的示例。

摘要由CSDN通过智能技术生成

该文章主要讲述了如何使用Python和Selenium模拟人类操作，破解验证码。首先，通过Selenium模拟操作获取不带缺口的图片，然后获取带缺口的图片，对比两张图片像素点的RGB值，得到缺口位置，最后模拟拖动滑块，通过匀加速匀减速运动来完成验证。

验证码获取网站为 http://www.geetest.com/。

极验滑动验证码比图形验证码的识别难度更大，其原理是将图片拖动到缺口处，然后拼合图像进行验证。该验证码会生成三个加密参数，通过表单提交到后台进行验证。极验验证码还采用了机器学习的方法来识别是否为恶意程序进行识别，并采用防模拟、防伪造和防暴力等方式进行保护，只需要 0.4 秒就可以完成验证，防止资源滥用和盗取。

通常情况下，只要我们的程序不是恶意的，并且遵守爬虫协议，就可以使用该验证码。但是请务必不要给服务器造成负担。

极验滑动验证码的识别思路可以通过模拟人类的操作方式来完成验证。这个过程分为三个步骤：模拟点击验证按钮、识别滑动缺口的位置和模拟拖动滑块。其中，第一步比较简单，第二步则需要使用图像处理技术，通过对比两张图片的像素差异来确定缺口的位置。第三步则需要模拟人类的移动轨迹，而人类移动轨迹是先加速后减速的，因此需要采用一些特殊方法来模拟这个过程，以通过验证。

Ps：动手能力弱的小伙伴可以直接访问www.ttocr.com进行识别

具体的实现过程可以参考以下 Python 代码：

# 注册的用户名和密码

email = ''

password = ''

class CrackGeetest():

def __init__(self):

self.url = 'https://account.geetest.com/login'

self.browser = webdriver.Chrome()

self.wait = WebDriverWait(self.browser, 20)

self.email = email

self.password = password