斗鱼弹幕爬虫

该博客介绍了如何使用爬虫抓取斗鱼平台的弹幕和礼物数据,并将其存储在MongoDB中。内容包括弹幕协议的公开信息,如何查询礼物送出记录,以及对主播收入和用户行为的潜在分析。作者提醒,需关注多天数据以进行有效分析,并提供了源码供读者研究。
摘要由CSDN通过智能技术生成

效果如下

默认数据会保存到MongoDB,以房间号+时期

目前是保存了弹幕和礼物两种类型,斗鱼的弹幕协议已经公开,想要抓取更多信息的可以去看看。

可以用如下语句查询礼物送出记录:

db.getCollection('4537144_2018_12_27').find({gift_id: {
    '$exists': true}})

可以将礼物价值加起来,计算某主播一天的总收入(然后不清楚斗鱼与主播自己之前如何分成的)。

还可以看看用户昵称、牌子、等级。一天的数据是没有价值的,多抓几天的,进行横向对比才有意思。

/* 1 */
{
    &#
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值