python selenium爬取斗鱼王者荣耀直播页面

目标网站
在这里插入图片描述
在这里插入图片描述
抓取第一个直播的标题
在这里插入图片描述

在这里插入图片描述
现在来实现批量抓取
在这里插入图片描述
这里用xpath匹配
在这里插入图片描述
第一页抓取完毕,开始抓取剩下的页数
在这里插入图片描述
一共31页,每页数据为一个列表,全部数据套在一个大列表中

以下是完整代码:

# 导入模块
import time
from selenium import webdriver

result_list = []
# 创建对象
window = webdriver.Chrome('./chromedriver')
# 访问网页
window.get('https://www.douyu.com/g_wzry')
time.sleep(2) # 设置一个延迟等待请求页面加载完
aaa = window.find_elements_by_xpath('//h3[@class="DyListCover-intro"]')
temp_list = []
for title_element in aaa:   # 打印标题
    temp_list.append(title_element.text)
result_list.append(temp_list)
print('*'*100)

page = 2
while True:     # 因为页数是根据当前在线的主播数量动态改变的,所以一直循环直到最后一页找不到退出循环
    try:
        next = window.find_element_by_link_text(str(page))
        next.click()
    except:
        break
    time.sleep(2) # 设置一个延迟等待请求页面加载完
    aaa = window.find_elements_by_xpath('//h3[@class="DyListCover-intro"]')
    temp_list = []
    for title_element in aaa:   # 打印标题
        temp_list.append(title_element.text)
    result_list.append(temp_list)
    print(page,'*' * 100)
    page+=1

print(result_list)
# 关闭窗口
window.quit()


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值