先来放上b站的《染色体》链接:https://www.bilibili.com/video/BV1Xf4y1A75e
参考博客:https://blog.csdn.net/weixin_29130369/article/details/112744783
b站弹幕的爬取
通过Chrome开发者工具里面的Network页面,可以找到B站弹幕数据的接口。
- 爬取b站弹幕数据的API:https://api.bilibili.com/x/v1/dm/list.so?oid=XXX
- 后面有个oid,oid后面是一串数字,不同的网页有着不同的数字串
- 怎样获取oid?首先要获取cid。
【cid的获取】
打开浏览器控制台,点击network:找到下面这个,即这个歌曲的cid就是404210194
这样就可以的到弹幕的真正地址:https://api.bilibili.com/x/v1/dm/list.so?oid=404210194
只要解析这个网址,解析网页后就可以获取我们想要的数据了
【代码】