效果
输入要爬取的视频的BV号即可爬取该视频的弹幕。
过程
基本思路
基本的思路很简单,还是老步骤:
1、构造爬取的url
2、解析返回的数据
3、使用json或Xpath或正则表达式提取数据
4、保存数据
寻找url地址
第一步
刚开始还是从网页版中寻找url地址,结果请求很多,找了半天也没有找到
第二步
于是我们可以访问一下手机版的页面,而根据常识,弹幕这种东西一般是通过ajax来请求的,所以我们过滤一下,只看异步请求。
此时请求就变得少了很多,但是依然没有找到我们需要的弹幕数据,此时才发现我们并没有点击播放视频。
第三步
弹幕是在视频播放的过程中播放的,理所当然只有当我们播放视频并且打开弹幕后才会请求弹幕