先来放上b站的《染色体》链接:https://www.bilibili.com/video/BV1Xf4y1A75e
参考博客:https://blog.csdn.net/weixin_29130369/article/details/112744783
b站弹幕的爬取
通过Chrome开发者工具里面的Network页面,可以找到B站弹幕数据的接口。
- 爬取b站弹幕数据的API:https://api.bilibili.com/x/v1/dm/list.so?oid=XXX
- 后面有个oid,oid后面是一串数字,不同的网页有着不同的数字串
- 怎样获取oid?首先要获取cid。
【cid的获取】
打开浏览器控制台,点击network:找到下面这个,即这个歌曲的cid就是404210194

这样就可以的到弹幕的真正地址:https://api.bilibili.com/x/v1/dm/list.so?oid=404210194

只要解析这个网址,解析网页后就可以获取我们想要的数据了
【代码】

本文介绍如何爬取B站视频的弹幕。首先,通过分析Chrome开发者工具中的Network页面找到弹幕数据的API接口:https://api.bilibili.com/x/v1/dm/list.so?oid=XXX,其中XXX为oid。oid的获取方法是找到视频对应的cid,例如歌曲《染色体》的cid为404210194,从而得到弹幕API的具体地址。解析该URL即可获取所需弹幕数据。
最低0.47元/天 解锁文章
1012

被折叠的 条评论
为什么被折叠?



