本文CSDN资源:https://download.csdn.net/download/weixin_47040861/89624031
鉴于该资源随时都有暴毙的风险,所以免费上传
之前阿B的弹幕都是使用XML的方式进行传输,但是在某次更新后改用了protobuf这一更加高效的数据传输方式,导致之前所有基于XML爬取弹幕的方式均已失效,所以这里上传一个目前可以使用的案例(2024年8月8日)。
protobuf需要对原始数据进行反序列化才能提取到正确的弹幕内容,由于项目中已经包含了反序列化文件“person_pb2.py”,这里不做过多赘述。
项目启动后会生成一张每分钟弹幕数量的折线图和一张弹幕关键词词云: