Python爬虫——Selenium方法爬取LOL页面

Selenium介绍

Selenium 是一个用于自动化Web应用程序测试的工具,但它同样可以被用来进行网页数据的抓取(爬虫)。Selenium 通过模拟用户在浏览器中的操作(如点击、输入、滚动等)来与网页交互,并可以捕获网页的渲染结果,这对于需要JavaScript渲染的网页特别有用。

    1. 安装Selenium
      首先,你需要安装Selenium库。可以通过pip安装:

      pip install selenium
      
    1. 下载WebDriver
      Selenium需要WebDriver来与浏览器交互。WebDriver是一个浏览器特定的驱动程序,允许Selenium控制浏览器。你需要根据你的浏览器(如Chrome、Edg等)下载相应的WebDriver。
    • 如何下载使用:
      • 直接在网上搜索你所使用的浏览器驱动,下载和你浏览器相同版本的驱动
      • 比如edg浏览器:
        在这里插入图片描述
        在这里插入图片描述
      • 下载和你的浏览器相同的驱动
      • 将下载好的驱动放在你的python.exe同一个目录下
      • 或者使用时可以在代码中指定WebDriver的路径

用Selenium方法爬取LOL每个英雄的图片及名字

  • 使用Selenium方法相比requests方法爬取数据要简便的多

  • 爬取步骤:

    • 1、指定浏览器的驱动,并通过网址请求页面
    • 2、获取想要的数据
  • 1、指定浏览器的驱动,并通过网址请求页面

    • 这里我们使用的是edg驱动(已经将驱动放在了环境变量中)
    • 给定网址https://101.qq.com/#/hero
    • Selenium方法虽然不需要requests方法中那些前面的步骤,但还是需要查看索要爬取页面的请求方式(按F12),查看方法相同
      在这里插入图片描述
      # 指定驱动
      driver = webdriver.Edge()
      # 请求页面 get请求方式
      driver.get(<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值