selenium+BeautifulSoup 爬虫

爬取dy平台主播名字,在线人数

from selenium import webdriver
from bs4 import BeautifulSoup as bs
import time

driver = webdriver.PhantomJS()
driver.get("https://www.douyu.com/directory/all")
#while True:
i = 1
while True:
    #html源码
    html = driver.page_source
    #    创建解析对象
    soup = bs(html,"lxml")
#    直接调用方法查找元素
#    存放所有主播的元素对象
    names = soup.find_all("span",{"class":"dy-name ellipsis fl"})
#    存放人气的元素对象
    nums = soup.find_all("span",{"class":"dy-num fr"})

#    name和number 是一个对象,get_text()
    for name,number in zip(names,nums):
        print("\t观众人数:",number.get_text().strip(),end="")
        print("\t主播名字:",name.get_text().strip())         
    page = driver.find_element_by_class_name("jumptxt").send_keys(i)

    if driver.page_source.find("shark-pager-disable-next") == -1:   
        driver.find_element_by_class_name("shark-pager-submit").click()
        time.sleep(5)
        i+=1
#        driver.find_element_by_class_name("shark-pager-next").click()
    else:
        break
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值