python爬斗鱼直播房间名和主播名,python爬虫爬取斗鱼直播主播名,主播房间名,主播房间地址以及目前热度(热度会变,以当时为准)代码...

import json

import jsonpath

import requests

import time,re

bese_url = "https://www.douyu.com/gapi/rkc/directory/0_0/{}"

head = {

"user-agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"

}

for i in range(0,100):

bese_url1 = bese_url.format(i)

dakai=requests.get(bese_url,headers = head)

yeshu=dakai.text

yeshu1 = json.loads(yeshu)

yeshu2 = jsonpath.jsonpath(yeshu1,"$..data.rl")[0]

for xx in yeshu2:

xx = str(xx)

print(xx)

mingzi = re.findall("'rn': '(.*?)',",xx)

mingzi1 = ''

for i in mingzi:

mingzi1+=i

renming = re.findall("'nn': '(.*?)',",xx)

renming1=""

for i in renming:

renming1+=i

fangjian = re.findall("'url': '/(.+?)',", xx)

fangjian1 = ''

for i in fangjian:

fangjian1+=i

print(fangjian1)

redu = re.findall("'ol':(.*?),",xx)

redu1 = ''

for i in redu:

redu1 +=i

fangjian1 = 'https://www.douyu.com/'+fangjian1

quanbu = mingzi1+','+renming1+','+fangjian1+','+redu1+'\n'

print(quanbu)

with open('E:/斗鱼/'+'斗鱼.csv','a+',encoding="utf-8-sig")as f:

f.write(quanbu)

time.sleep(5)

会写出一个Excel表格,存放在E:\斗鱼下(记得在E盘下创建一个“斗鱼”文件夹,没写创建文件夹的代码)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值