selenium被识别怎么办

selenium被识别怎么办

加上以下内容,webdriver配置
from selenium import webdriver
option = webdriver.ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
option.add_argument("--disable-blink-features=AutomationControlled")
# option.add_argument('--headless')
# option.add_argument('--disable-dev-shm-usage')
# option.add_argument('--no-sandbox')
bro = webdriver.Chrome(executable_path='D:/webdriver/chromedriver',options=option)
bro.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """
                Object.defineProperty(navigator, 'webdriver', {
                  get: () => undefined
                })
              """
})
bro.get('你要打开的url')
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: 如果您的网站检测到了Selenium,有几种方法可以尝试: 1. 尝试使用不同的浏览器驱动程序,例如Chrome,Firefox或Edge。 2. 尝试使用不同的浏览器版本。 3. 尝试使用不同的电脑操作系统。 4. 尝试使用不同的网络连接,例如使用VPN或代理。 5. 尝试在程序中加入人为暂停,使它看起来更像人在使用浏览器。 6. 尝试使用不同的编程语言编写程序,例如Python、Java、C#等。 如果仍然无法解决问题,您也可以尝试使用其他类似的自动化工具,例如Puppeteer或Playwright。 ### 回答2: 如果selenium被检测到了,我们可以尝试以下方法进行处理: 1. 更改浏览器标识:Selenium是通过检测浏览器标识来判断是否使用了自动化工具,可以尝试修改浏览器标识字符串,使其看起来更像是真实用户在使用浏览器。 2. 使用代理服务器:使用代理服务器可以隐藏真实的 IP 地址和浏览器信息,从而减少被检测到的几率。 3. 添加延时操作:通过在爬取过程中添加适当的延时操作,模拟真实用户的操作习惯,减少被检测到的概率。 4. 使用随机的用户代理和浏览器指纹:在每次请求时随机生成用户代理和浏览器指纹,增加识别的难度。 5. 使用无头浏览器:无头浏览器是一种不显示界面的浏览器,可以更好地模拟真实的用户行为,减少被检测到的可能。 6. 使用IP旋转:使用IP旋转服务,每个请求使用不同的IP地址,增加被检测到的困难度。 7. 避免频繁请求:过于频繁的请求容易引起被检测,并可能导致被封禁,可以适当减少请求的频率来降低被检测的概率。 请注意,使用Selenium进行爬取时应遵循网站的规则和政策,尊重网站的使用限制和爬取频率要求,避免对网站的正常运行造成干扰。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小帆芽芽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值