Scrapy:b站爬虫之抓包过程

最新推荐文章于 2024-07-06 23:16:57 发布

wsw1055

最新推荐文章于 2024-07-06 23:16:57 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/weixin_45938100/article/details/104357766

版权

本文详细介绍了使用Scrapy爬取B站数据的过程，包括抓包分析点赞、投币、收藏、在线观看人数以及弹幕内容的方法。通过分析API接口和WebSocket数据，揭示了如何获取动态变化的在线人数，并解析弹幕信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Scrapy:b站爬虫之抓包过程

一、内容说明

一共爬取八个数据，可分为四项：

1、标题（直接xpath，不用抓包）

2、点赞、投币、收藏

3、在线观看人数

4、弹幕内容、时间、发送时间

二、抓包过程

1、点赞，投币，收藏

1、获取信息源：
用xpath试过之后，发现无法获取，推测是api内容
2、尝试获取api接口：
F12，netwoek下ctrl+f搜索转发的数量（上热门的一般就转发量比较少）在这里插入图片描述
3、进一步验证：
打开该api接口网址
获得数据：{“code”:0,“message”:“0”,“ttl”:1,“data”:{“aid”:89348202,“bvid”:"",“view”:1404996,“danmaku”:9684,“reply”:10236,“favorite”:39972,“coin”:166225,“share”:4815,“like”:240516,“now_rank”:0,“his_rank”:0,“no_reprint”:1,“copyright”:1,“argue_msg”: