python 爬取直播_python 斗鱼直播间爬取代码

最新推荐文章于 2022-06-29 14:48:50 发布

weixin_39544333

最新推荐文章于 2022-06-29 14:48:50 发布

阅读量259

点赞数

文章标签： python 爬取直播

【实例简介】

爬取所有斗鱼直播间信息。，模拟chrome浏览器操作

【实例截图】

【核心代码】

#-*- coding: utf-8 -*-

import unittest

from selenium import webdriver

from bs4 import BeautifulSoup as bs

class douyu(unittest.TestCase):

#初始化方法

def setUp(self):

self.option = webdriver.ChromeOptions()

self.option.add_argument("test-type")

self.driver = webdriver.Chrome(chrome_options=self.option)

self.driver=webdriver.Chrome()

self.num=0

# 测试方法必须有test开头

def testDouyu(self):

self.driver.get("https://www.douyu.com/directory/all")

while True:

soup= bs(self.driver.page_source,"lxml")

names=soup.find_all("h3",{"class":"ellipsis"})

numbers=soup.find_all("span",{"class":"dy-num fr"})

#zip(names,numbers)将这两个列表合并为一个元组

for name,number in zip(names,numbers):

print(u"观众人数:%s"%number.get_text().strip() u"\t房间名:%s"%name.get_text().strip())

self.num =1

if self.driver.page_source.find("shark-pager-disable-next")!=-1:

break

self.driver.find_element_by_class_name("shark-pager-next").click()

#测试结束后执行的方式

def tearDown(self):

print("当前直播人数: %d"%self.num)

self.driver.quit()

if __name__=="__main__":

#启动测试模块

unittest.main()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39544333

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬取斗鱼直播信息

weixin_50843522的博客

10-11

3871

一、需求爬取斗鱼直播网站信息，如直播名字、主播名字、热度、图片和房间网址，将这些数据保存到csv文件中，并单独创建文件夹保存图片。斗鱼直播网址：https://www.douyu.com/g_LOL 二、分析url 先单击【直播】，然后单击分页，发现分页的时候url没发生变化，基本可以确定是通过异步加载的。现在找到了异步url。此时，可以直接向url发送请求后去数据，还可以使用selenium获取加载之后的网页总数据，提取。三、数据提取有两种办法可以选择：（1）如果使用ajax异步url，

python爬取付费直播的视频_教你用20行代码爬取直播平台弹幕（附源码）

weixin_42498909的博客

01-14

5437

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。Python爬虫、数据分析、网站开发等案例教程视频免费在线观看https://space.bilibili.com/523606542 基本开发环境Python 3.6Pycharm相关模块的使用importrequests斗鱼直播视频弹幕爬取分析斗鱼就选择的直播视频，毕竟大主播弹幕发送会多...

参与评论您还未登录，请先登录后发表或查看评论

python selenium爬取斗鱼所有直播房间信息过程详解

09-18

主要介绍了python selenium爬取斗鱼所有直播房间信息过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

python怎么实现直播_明白了以下5点思路，你也能用Python实现直播推流效果（技术活）...

weixin_39735005的博客

11-20

620

今天为大家带来的内容是：明白了以下5点思路，你也能用Python实现直播推流效果（技术活）本文内容主要介绍了Python实现直播推流效果，主要是通过opencv读取视频对视频分割为帧，本文通过实例代码讲解的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下！开始之前我们先来看看效果图：思路概括：opencv读取视频将视频分割为帧对每一帧进行处理(opencv模板匹配)在将此帧写入pipe管道利...

python 爬取直播_python---爬取某鱼直播

weixin_39594080的博客

11-24

393

用了selenium，才深刻的体会到它的好处，更加的方便更加的快捷，更容易的获取网页的信息。这里用selenium爬取某鱼直播下面的前五页的直播间信息，例如直播房间名，主播名，直播热度，以及直播的类别。即图片红色下横线的东西。首先进入斗鱼的页面，选择直播，接着复制url备用，然后就按F12去分析做爬虫的步骤还是那样，先去原网页的地址找到数据的位置，接着提取出需要的数据，在整理起来，保存起来。这里我...

如何利用python爬虫爬取直播网站信息_[Python爬虫]使用Python爬取静态网页-斗鱼直播...

weixin_39575937的博客

12-04

478

原标题：[Python爬虫]使用Python爬取静态网页-斗鱼直播好久没更新Python相关的内容了，这个专题主要说的是Python在爬虫方面的应用，包括爬取和处理部分第一节我们介绍如何爬取静态网页[Python爬虫]使用Python爬取动态网页-腾讯动漫(Selenium)http://www.aibbt.com/a/18049.html[Python爬虫]使用Python爬取静态网页-斗鱼直播...

python爬取斗鱼鱼吧_学会python可以上天！20行代码获取斗鱼平台房间数据，就是这么牛逼！...

weixin_39645268的博客

12-10

213

Python(发音：英[?pa?θ?n]，美[?pa?θɑ:n])，是一种面向对象、直译式电脑编程语言，也是一种功能强大的通用型语言，已经具有近二十年的发展历史，成熟且稳定。它包含了一组完善而且容易理解的标准库，能够轻松完成很多常见的任务。它的语法非常简捷和清晰，与其它大多数程序设计语言不一样，它使用缩进来定义语句。Python支持命令式程序设计、面向对象程序设计、函数式编程、面向切面编程、泛型编...

python刷直播人气_python3爬取斗鱼某些版块的主播人气

weixin_35844772的博客

01-29

953

python 3爬取斗鱼某些版块的主播人气1.爬虫版块import Test3import urllib.requestfrom bs4 import BeautifulSoupimport jsondef Reptilian(url):#添加头部,伪装浏览器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleW...

python爬取斗鱼弹幕,Python爬虫日记八：利用API实时爬取斗鱼弹幕

weixin_29048775的博客

03-26

1041

斗鱼一：前言这些天一直想做一个斗鱼爬取弹幕，但是一直考试时间不够，而且这个斗鱼的api接口虽然开放了但是我在github上没有找到可以完美实现连接。我看了好多文章，学了写然后总结一下。也为后面数据分析做准备，后面先对弹幕简单词云化，然后再对各个房间的数据可视化。代码地址：这次爬取的房间是斗鱼直播的芜湖大司马，因为他人气比较多，方便分析。主播也是我老乡，嘿嘿。然后把弹幕的信息的uid，昵称，等级，弹...

python爬斗鱼直播房间名和主播名,python爬虫爬取斗鱼直播主播名，主播房间名，主播房间地址以及目前热度（热度会变，以当时为准）代码...

weixin_33967069的博客

03-26

247

import jsonimport jsonpathimport requestsimport time,rebese_url = "https://www.douyu.com/gapi/rkc/directory/0_0/{}"head = {"user-agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML,...

selenium提取斗鱼平台信息

Bocker_Will的博客

05-18

338

写在开始：最近在学selenium模块时，尝试使用selenium提取了斗鱼直播的房间信息，其中有两处bug，一，提取完第一页信息完之后，反转到第二页时信息提取错误，第二就是，拿不到直播的封面，后续我会继续修改，本源码我是在网上查找的，但是源码也有问题，我是在原有的基础上修改了一下这是我自己写的： from selenium import webdriver import time class Douyu(object): def __init__(self): ...

python自动进直播_Python实现自动录制虎牙直播

weixin_39641231的博客

11-30

478

Python如何实现录制虎牙直播需求之前比较喜欢看虎牙的直播，但是由于时间比较忙没办法看，最近学完Python的基础课程后考虑能否用Python来实现自动录像，这样想什么时候看就能什么时候看，比较方便。准备工作仅从使用角度来看，需要安装：Python（开玩笑怎么能没有这个）Python所需的模块（requests、json、re）录屏软件（ffmpeg）如果想要理解代码进行修改的话建议学一些Pyt...

爬虫入门经典(十六) | 一文带你爬取斗鱼主播相关信息

热门推荐

不温卜火

11-01

5万+

大家好，我是不温卜火，是一名计算机学院大数据专业大三的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只在csdn这一个平台进行更新，博客主页：https://buwenbuhuo.blog.csdn.net/。 PS：由于现在越来越多的人未经本人同意直接爬取博主本人.

Python爬取斗鱼直播网站信息

weixin_43520450的博客

10-10

2451

python 直播源地址_斗鱼直播间真实rtmp地址获取(含工具类下载）

weixin_36138462的博客

02-09

4964

背景图片斗鱼直播间比赛截图最近在看英雄联盟比赛的时候，就在思考如何取直播的真实rtmp播放地址，放到类似于(potplayer播放器)中，或者自己也可以写一个app来玩一下，所以便有了本篇的内容。1：工具类下载搜索关键字："斗鱼直播间真实rtmp地址获取"下载工具下载下来是一个可执行的exe文件鼠标双击即可运行，然后输入房间号(房间号通常为1~7位纯数字，浏览器地址栏中看到的房间号不一定是真实ri...

Python爬虫实战--斗鱼直播爬虫

雾里看花

11-21

5839

前言：稍微总结一下前面我们所学到的内容吧！在前面的实战学习中，我们学会如何使用requests来获取网页源码，并从中提取出我们所需要的数据，那接下来，我们也将进一步学会使用selenium获取网页，分析网页，和提取数据。目标站点分析 **目标URL：**https://weheartit.com/inspirations/beach?page=1 明确内容：本次爬虫实战里，我们将要爬取斗...

爬虫入门实战：斗鱼弹幕数据抓取，附送11节入门笔记

黑马程序员官方博客

06-29

1413

这个模块为异步socket的服务器客户端通信提供简单的接口。该模块提供了异步socket服务客户端和服务器的基础架构。

用selenium爬取直播信息

阿牛的博客

01-15

1695

目前是直播行业的一个爆发期，随着互联网和网络直播市场的快速发展，相信未来还有广阔的发展前景。所以今天我用selenium爬取一下斗鱼直播信息，现将代码分享给大家。

爬虫中使用selenium实现对斗鱼直播的各个房间标题、主播id，直播内容类型和热度信息的爬取

qq_52262831的博客

11-26

2856

每日分享：千万不要因为别人的否定就开始自我否定，人生本来就是一个主观的过程，别人是否喜欢你，其实是对方世界的事，所以面对别人的不喜欢，不要自卑不要刻意讨好，你要专注的做自己思路分析： url（网页的url）创建driver对象发送get请求 parse data（分析处理数据） save data（保存数据）翻页在一个循环中反复执行4、5、6操作，如果到最后一页则跳出循环。再说一些我写代码遇到的一些问题：用xpath可以找到你想找的元素，但如果要对其进行点击操作，需要先下

使用Python协程gevent爬取斗鱼直播颜值页图片教程

该资源是一个关于使用Python协程库gevent进行网络爬虫的实践案例，具体目标是爬取斗鱼网站颜值分类页面的主播图片。通过分析网站的请求，发现数据是通过Ajax以JSON格式获取的，主要涉及的技术点包括Python协程、...