解决selenium + chromedriver被知乎反爬的问题

在使用selenium模拟登录知乎时遇到点击无响应的问题,原因是知乎可能识别出selenium。解决方法是通过webdirver接管已打开的浏览器进行登录。具体步骤包括在环境变量PATH中添加chrome路径,通过cmd命令启动浏览器,然后在pycharm中运行登录代码,成功绕过反爬策略。此方法虽然笨拙,但有效。
摘要由CSDN通过智能技术生成
写在前面

前两天想爬知乎,发现用selenium模拟登录时出现了问题——点击登录按钮没反应。。。
无论是用webdirver模拟点击,还是自己手动点击,都无法跳转到首页。
后来发现大概是知乎识别出selenium了。把我们给反爬了。

解决办法

解决办法就是——用webdirver接管我们自己打开的浏览器,然后再进行登录操作。

具体的接管方法,这篇文章已经说得非常清楚了:https://www.cnblogs.com/HJkoma/p/9936434.html

具体步骤
在环境变量中PATH里将chrome的路径添加进去:
  1. 打开控制面板,点击“高级系统设置”
    在这里插入图片描述
  2. 进入系统属性,点击下方“环境变量”
    在这里插入图片描述
  3. 找到Path,点击“编辑”
    在这里插入图片描述
  4. 在变量值中添加配置路径 C:\Program Fil
Selenium是一个用于Web应用程序测试的自动化工具。它允许你编写脚本来模拟用户的行为,如点击、输入、导航等。结合ChromeDriverSelenium可以控制Chrome浏览器的各种操作,包括模拟键盘快捷键操作。 在Selenium中模拟CTRL+F查找操作通常分为以下步骤: 1. 打开目标网页。 2. 等待页面加载完成。 3. 触发CTRL+F快捷键查找操作。 4. 输入查找内容并获取搜索结果。 以下是一个使用Python语言和Selenium实现CTRL+F查找操作的代码示例: ```python from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.action_chains import ActionChains # 启动Chrome浏览器 driver = webdriver.Chrome() # 打开目标网页 driver.get("http://example.com") # 等待页面加载完成 driver.implicitly_wait(10) # 触发CTRL+F快捷键 # 首先需要定位到浏览器中的搜索框,通常是页面的一个可编辑元素 # 然后使用ActionChains类模拟按键操作 search_box = driver.find_element_by_name('q') # 这里的'name'属性根据实际页面搜索框的name属性值来定位 ActionChains(driver).key_down(Keys.CONTROL).send_keys('f').key_up(Keys.CONTROL).perform() # 输入查找内容 search_box.send_keys('需要查找的文本') # 如果需要进一步操作搜索结果,可能需要编写额外的逻辑代码 ``` 请注意,上述代码只是一个基础示例,实际使用时需要根据目标网站的具体情况来调整代码中的元素定位和逻辑。
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值