反爬虫之利用chrome的debug模式破解不允许selenium模拟的网站

原因: 我们利用selenium爬取很多网站都很方便,但是有的网站如知乎和淘宝会检测selenium.
这些网站如果直接通过selenium打开网站,selenium会携带一些指纹信息,如:window.navigator.webdriver
网站js通过检测类似的指纹信息,可以检测到你在使用自动化工具,就不让你登录
解决:这时我们可以利用chrome的远程调试结合selenium来遥控chrome进行绕过检测,这样不会携带指纹信息
1.首先 cmd 里面进入 chrome.exe的目录下(也可以把此目录设置为环境变量,这样就能在任意位置执行chrome.exe)
例如:cd C:\Program Files (x86)\Google\Chrome\Application

2.执行命令 ,打开chrome的远程调试模式

chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"
  • 注意端口不要被占用,防火墙要关闭
  • user-data-dir:指定配置文件目录

3.编写代码利用selenium远程控制chrome的debug

from selenium import webdriver

chrome_options = webdriver.ChromeOptions()
chrome_options.add_experimental_option('debuggerAddress','127.0.0.1:9222')

browser = webdriver.Chrome(executable_path="D:\soft\PY\chromedriver.exe",chrome_options=chrome_options)

browser.get('http://www.taobao.com')

4.这样知乎淘宝就检测不到selenium指纹信息了,可以开爬了
————————————————
版权声明:本文为CSDN博主「寸草心2130」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_35531549/article/details/89023525

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Selenium是一个用于自动化浏览器操作的工具,可以模拟用户在浏览器中的行为。然而,一些网站会采取反爬虫的措施,来阻止Selenium的使用。为了应对这些反爬虫措施,可以使用一些方法来反爬虫。 其中一个常见的反爬虫手段是检测浏览器的User-Agent头部信息,因为Selenium的默认User-Agent是可被识别的。为了应对这种情况,可以使用Selenium的`ChromeOptions`类来修改User-Agent,通过修改User-Agent来伪装成普通浏览器。在引用的代码示例中,使用了`options.add_argument('--user-agent=Mozilla/5.0 HAHA')`来替换User-Agent头部信息。 此外,还有其他一些常见的反爬虫手段,比如基于身份识别、基于爬虫行为和基于数据加密等。如果遇到这些反爬虫手段,可以根据具体情况采取相应的应对措施。例如,在基于身份识别进行反爬的情况下,可以通过模拟登录来获取合法的访问权限;在基于爬虫行为进行反爬的情况下,可以通过调整访问频率或添加随机延时来模拟真实用户的行为;在基于数据加密进行反爬的情况下,可以使用Selenium来执行JavaScript代码来解密数据。 综上所述,针对不同的反爬虫手段,可以采取相应的应对措施来反爬虫。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python爬虫第二课 Selenium介绍和反爬技术](https://blog.csdn.net/fegus/article/details/124447201)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值