近几年来直播越来越火,看直播也成为了人们生活的娱乐项目
个人也是比较喜欢看直播,看着主播的搞笑的操作和弹幕不时会开怀大笑。
于是就想能不能把弹幕抓取下来,带着这个问题我就点开了一个直播间。按照以前学过的方法好像根本没有办法弄到弹幕那一块,
于是赶紧去网上查,发现网上有不少人已经做了。呃......怎么说,大概了解了获取弹幕的原理,就是通过socket向斗鱼弹幕服务器发送请求,
然后服务器会返回数据给你,但是他们的具体操作不是太明白。没办法只好继续搜索,终于看到了一个知乎用户的专栏里的一篇文章,
@Ehco的 从零开始写Python爬虫 --- 爬虫应用: 利用斗鱼Api抓取弹幕 地址:https://zhuanlan.zhihu.com/p/28164017,
因为斗鱼现在已经开放了弹幕服务器接入协议,我也看了其他人也提到了这个,但具体怎么用这个协议还是不明白。
通过读了Ehco他的文章后才一点点的弄清楚。
因为之前完全不知道怎么弄,所以代码写的和原作者十分类似。
但我在注释中写了一些自己的理解,如果觉得不清楚可以去看原作者的文章。
也十分感谢原作者分享了这么好的文章。
好吧,下面就来说说我的理解
首先是斗鱼协议
《斗鱼弹幕服务器第三方接入协议v1.4.1》:
http://dev-bbs.douyutv.com/forum.php?mod=viewthread&tid=115&extra=page%3D1
《斗鱼第三方开放平台API文档v2.0》:
http://dev-bbs.douyutv.com/forum.php?mod=viewthread&tid=108&extra=page%3D1
这里我们只需要看第一个就行了
然后再看协议的内容
首先是协议头,这个最重要了,每个请求前面都要带这个
这部分的代码