Scrapy:b站爬虫之抓包过程

本文详细介绍了使用Scrapy爬取B站数据的过程,包括抓包分析点赞、投币、收藏、在线观看人数以及弹幕内容的方法。通过分析API接口和WebSocket数据,揭示了如何获取动态变化的在线人数,并解析弹幕信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Scrapy:b站爬虫之抓包过程

一、内容说明

一共爬取八个数据,可分为四项:
1、标题(直接xpath,不用抓包)
2、点赞、投币、收藏
3、在线观看人数
4、弹幕内容、时间、发送时间

二、抓包过程

1、点赞,投币,收藏

1、获取信息源:
用xpath试过之后,发现无法获取,推测是api内容
2、尝试获取api接口:
F12,netwoek下ctrl+f搜索转发的数量(上热门的一般就转发量比较少)在这里插入图片描述
3、进一步验证:
打开该api接口网址
获得数据:{“code”:0,“message”:“0”,“ttl”:1,“data”:{“aid”:89348202,“bvid”:"",“view”:1404996,“danmaku”:9684,“reply”:10236,“favorite”:39972,“coin”:166225,“share”:4815,“like”:240516,“now_rank”:0,“his_rank”:0,“no_reprint”:1,“copyright”:1,“argue_msg”:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值