虎牙直播弹幕抓取 相关资料整理

当前可用项目

看大佬的汇总种类比较齐全,有其他开发需求直接fork修改就行

各种直播平台的直播流&弹幕流解析
https://github.com/wbt5/real-url

自行思路参考

1.简单难度:模拟http客户端,解析html节点
模仿实现难度比较低,但可见需要的运行资源成本比较高,虎牙修改网页时需要进行适配

Python Selenium简单爬取虎牙直播弹幕(仅学习)
https://blog.csdn.net/weixin_47190827/article/details/113351024

2.困难难度:转写虎牙官方实现方法,直接解析ws流
本来是打算自己换成Java尝试实现的(补:发现有其他类似项目:huya-danmu),不过看完解析发现着实麻烦…因为实际需求功能比较小,选择尝试换成python修改源码自用了,另外按文章参考理解一下逆向思路也是不错的

项目地址:
https://github.com/759434091/danmu-crawler

搭配食用的博客文章:
抓取虎牙直播弹幕流(WireShark&前端源码)

博客里面有些图片失效了,这里手动补充一下,剩下的按博客思路理解就好:
1.寻找WebSocket地址部分
在这里插入图片描述
2.分析源码部分,找到具体执行解析弹幕ws流的函数
在这里插入图片描述

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据引用\[1\]和引用\[3\]的代码,可以看出这段代码使用了Selenium库来抓取虎牙直播弹幕。首先,通过引入必要的库和设置浏览器选项,然后使用`webdriver.Chrome()`创建一个Chrome浏览器实例,并打开虎牙直播的网页。接下来,根据不同版本的代码,使用不同的方式来获取弹幕。 在第一版代码中,使用`find_elements_by_xpath`方法来定位弹幕元素,并通过遍历获取每个弹幕的文本内容。 在第二版代码中,使用`find_elements_by_class_name`方法来定位弹幕元素,并通过遍历获取每个弹幕的文本内容。同时,使用一个列表`bbb`来存储已经获取过的弹幕,以避免重复获取。 在第三版代码中,除了使用`find_elements_by_class_name`方法和列表`bbb`来获取和存储弹幕外,还添加了一个判断条件,当`bbb`列表的长度超过20时,删除最早的弹幕,以保持列表的长度不超过20。 综上所述,这段代码使用Selenium库来抓取虎牙直播弹幕,通过定位弹幕元素并遍历获取弹幕的文本内容。不同版本的代码在处理重复弹幕和控制弹幕数量方面有所不同。 #### 引用[.reference_title] - *1* *2* [Python Selenium简单爬取虎牙直播弹幕(仅学习)](https://blog.csdn.net/weixin_47190827/article/details/113351024)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [huya弹幕提取小尝试](https://blog.csdn.net/import_hair/article/details/123755909)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值