反爬虫四:检测selenium特征值

python学习交流公众号 Hello Python上线啦,欢迎关注

一:selenium 特征值是什么?及特征值监测意义

selenium是爬虫常用的手段之一,绕过各种js懒加载,模拟用户操作,拖动滑块验证码等,如某宝就有selenium 检测,当使用selenium去某宝或其他网站进行爬虫或者模拟登陆时,会出现滑动验证码,并且无论是用ActionChains滑还是手动滑,都会很委婉的告诉你“哎呀网络错误,请刷新”等等。
打开终端 console,输入 window.navigator.webdriver 可见返回true
selenium特征值有很多:

  1. window.navigator.webdriver
  2. window.navigator.languages
  3. window.navigator.plugins.length
二:selenium特征值检测时间,以webdriver 为例

前端加入如下js代码

var selenium_tag = window.navigator.webdriver;
if (selenium_tag == true){
    alert('你是机器人')
}

再使用selenium 进入页面时,就会监测到。

三:问题与探讨

1.selenium 特征值很多种,尽量都加入检测或检测多种,部分爬虫会通过selenium提前执行js的方式,抹去部分特征值
2.页面中加入跳转页面等操作,如a标签内href 跳转页面会优先执行页面js,避免js抹去指纹的问题
近期爬虫栏目将发布爬虫如何绕过selenium检测。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值