调用斗鱼API爬取直播间弹幕信息(用户昵称及弹幕内容)
查看《斗鱼弹幕服务器第三方接入协议v1.4.1》,了解斗鱼API的使用方法,即如何连接斗鱼弹幕服务器、维持连接及获取弹幕信息
Python调用斗鱼API爬取直播间弹幕信息代码和注释
爬取结果示例
1. 查看《斗鱼弹幕服务器第三方接入协议v1.4.1》,了解斗鱼API的使用方法,即如何连接斗鱼弹幕服务器、维持连接及获取弹幕信息
1.1 登陆授权
欲从后台获取弹幕信息的客户端在于服务器建立TCP连接后,需发起登陆请求(包括相关验证信息),后台验证请求信息无误后,返回登陆成功相应。
1.2 房间分组
为管理斗鱼的直播间及弹幕,后台服务器有两个重要概念:房间号和分组号。
房间号与主播的直播间地址为一一对应关系。一般直播间房间号可在其 URL地址中找到,例如 http://www.douyutv.com/301712其中301712即为房间号。
分组号为某特定直播间不同观众所在弹幕交流群体的标识。其意义主要为将人数过多弹幕信息量过大的直播间观众进行切割分片管理,以防止观众接收过多弹幕而导致机器负载过重。分组号为整数,一般从 0 开始动态增加改变。特别注意-9999 特殊分组号,该组成员将接受对应直播间全部弹幕,即“海量弹幕”分组。
登陆授权为获取弹幕的基础,而加入房间及其分组为获取指定直播间弹幕的必要条件。
1.3 弹幕信息
弹幕信息包括以下类型:
文字弹幕
领取在线鱼丸暴击消息
赠送礼物消息
用户进房通知消息(为感谢大力支持斗鱼平台的用户而设置的进房提示信息)
用户赠送酬勤通知消息
用户信息</