用程序控制的浏览器进行模拟人工操作时,可能会被对方识别到对应的浏览器的特征,认为我们运行的模拟浏览器是程序控制,从而出现验证码等反爬虫措施。那么修改浏览器的指纹是一个比较不错的方案,可以轻松的避开反爬虫验证。
举个例子:
在用pyppeteer库进行模拟浏览器时,有一个封装库叫pyppeteer_stealth,进行代码测试的时候,可以利用这个库进行一些参数的修改。只要我们在代码中加入这样一行方法就可以了。
修改参数后:
修改参数前:
在selenium中可以通过加载js文件的方式进行修改,具体的要下载对于的stealth.min.js,然后通过selenium中的execute_cdp_cmd方法进行加载引用即可。同样也可以达到修改浏览器的指纹信息。
with open('common/stealth.min.js','r') as f:
js = f.read()
print(js)
self.driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js})
另外还有canvas、webgl、字体、浏览器语言等设置,后面我会再继续介绍,目前在做模拟快排的时候,这些参数设置好,就可以正常运行浏览器了,可以在一定程度上避免对方的反爬。如需seo快排源码或软件,加我vx:dan_moln