selenium 轻松模拟登录企查查,获取企业详细信息链接

本文介绍了如何使用selenium进行网页模拟登录企查查,包括设置chrome选项、处理滑块验证,以及展示完整爬虫代码,以获取企业的详细信息链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对于爬虫,现在网上的教程也越来越多,方法也是五花八门,甚至出现了APP等爬虫软件。

下面我们将爬取著名的企查查
请添加图片描述
对于企查查网,我们需要做一些营业执照等信息的话,就需要公司的具体信息,例如公司名称,法定代表人,成立日期,注册金额等基础信息,如下图。
请添加图片描述

本文最最最要

def main():
    while True:
        option = webdriver.ChromeOptions()
        option.add_experimental_option('excludeSwitches', ['enable-automation'])  # webdriver防检测

        option.add_argument("--disable-blink-features=AutomationControlled")
        option.add_argument("--no-sandbox")
        option.add_argument("--disable-dev-usage")
        option.add_experimental_option("prefs", {
   "profile.managed_default_content_settings.images": 2})
        driver = webdriver.Chrome(executable_path=r'D:\chromedriver.exe',options=option)

设置参数如下:

  • ChromeOptions:是一个配置 chrome 启动是属性的类,就是初始化
  • binary_location:设置 chrome 二进制文件位置
  • add_argument:添加启动参数
  • add_extension、add_encoded_extension:添加扩展应用
  • add_experimental_option:添加实验性质的设置参数
  • debugger_address:设置调试器地址

下载chromedriver.exe驱动

根据你的谷歌浏览器的版本下载chromedriver,注意这里我们下载的版本要与自己的谷歌浏览器的版本相对应,再引入他的路径
在这里插入图片描述

点击事件

针对事件点击的话,这个就需要定位到你要模拟点击的标签,不然会报错,或者找不到。
注意:

  • 反应等待时间设置,不然再下一个事件点击之前,定位不了。
  • 标签精准定位
driver.delete_all_cookies()
url = "https://www.qcc.com/weblogin?back=%2F" #https://www.qcc.com/weblogin?back=%2F
driver.get(url)
time.sleep(10
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值