python爬虫----简单的抓取斗鱼弹幕

本文介绍了如何使用Python抓取斗鱼直播间的弹幕,通过理解斗鱼弹幕服务器接入协议,结合socket模块进行交互,实现弹幕的获取。在过程中涉及登录请求、入组消息、心跳维持等步骤,并分享了相关学习资源。
摘要由CSDN通过智能技术生成

近几年来直播越来越火,看直播也成为了人们生活的娱乐项目

个人也是比较喜欢看直播,看着主播的搞笑的操作和弹幕不时会开怀大笑。


于是就想能不能把弹幕抓取下来,带着这个问题我就点开了一个直播间。按照以前学过的方法好像根本没有办法弄到弹幕那一块,

于是赶紧去网上查,发现网上有不少人已经做了。呃......怎么说,大概了解了获取弹幕的原理,就是通过socket向斗鱼弹幕服务器发送请求,

然后服务器会返回数据给你,但是他们的具体操作不是太明白。没办法只好继续搜索,终于看到了一个知乎用户的专栏里的一篇文章,

@Ehco的   从零开始写Python爬虫 --- 爬虫应用: 利用斗鱼Api抓取弹幕  地址:https://zhuanlan.zhihu.com/p/28164017,

因为斗鱼现在已经开放了弹幕服务器接入协议,我也看了其他人也提到了这个,但具体怎么用这个协议还是不明白。

通过读了Ehco他的文章后才一点点的弄清楚。


因为之前完全不知道怎么弄,所以代码写的和原作者十分类似。

但我在注释中写了一些自己的理解,如果觉得不清楚可以去看原作者的文章。

也十分感谢原作者分享了这么好的文章。





好吧,下面就来说说我的理解



首先是斗鱼协议

《斗鱼弹幕服务器第三方接入协议v1.4.1》:

http://dev-bbs.douyutv.com/forum.php?mod=viewthread&tid=115&extra=page%3D1

《斗鱼第三方开放平台API文档v2.0》:

http://dev-bbs.douyutv.com/forum.php?mod=viewthread&tid=108&extra=page%3D1


这里我们只需要看第一个就行了




然后再看协议的内容

首先是协议头,这个最重要了,每个请求前面都要带这个



这部分的代码࿱

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值