VMLogin中文版 selenium 自动化常规防检测初探

本文探讨了Selenium在自动化测试时如何被网站检测到,重点介绍了通过VMLogin中文版和修改ChromeDriver来规避检测的方法。通过隐藏特定JavaScript变量,如'window.navigator.webdriver',以及在十六进制编辑器中修改ChromeDriver的预定义字符串,可以增强Selenium的匿名性和防止被网站识别。
摘要由CSDN通过智能技术生成

在用Chromeriver测试Selenium,我注意到有些页面可以检测到您正在使用Selenium,尽管根本没有自动化。即使我只是在手动浏览时,只要通过Selenium使用Chrome,我也经常会看到一个页面,上面说检测到了可疑的活动。我检查了我的用户代理和VMLogin中文版浏览器指纹,它们都与普通的铬浏览器完全相同。

当我以普通浏览这些站点时,一切都很好,但是使用Selenium的那一刻我就被检测到了。
理论上,自动化操作Chrome在任何Web服务器上看起来都应该完全相同,但不知怎么的,它们可以检测到。

使用selenium模拟浏览器进行数据抓取无疑是当下最通用的数据采集方案,它通吃各种数据加载方式,能够绕过客户JS加密,绕过爬虫检测,绕过签名机制。它的应用,使得许多网站的反采集策略形同虚设。由于selenium不会在HTTP请求数据中留下指纹,因此无法被网站直接识别和拦截。

这是不是就意味着selenium真的就无法被网站屏蔽了呢?非也。selenium在运行的时候会暴露出一些预定义的Javascript变量(特征字符串),例如"window.navigator.webdriver",在非selenium环境下其值为undefined,而在selenium环境下,其值为true(如下图所示为selenium驱动下Chrome控制台打印出的值)。

我所要做的一切是为了确保 c d c 不 再 以 文 档 变 量 的 形 式 存 在 , 而 v o i l a ( 下 载

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值