BiliBili漫画爬虫研究 (附代码Github链接)

该项目使用Python实现BiliBili漫画的多线程下载,每话漫画导出为PDF,并能合并为Kindle兼容格式。详细分析了漫画详情获取与单集漫画下载的步骤,通过分析网络请求获取所需数据。提供了GitHub链接以供查看完整代码。
摘要由CSDN通过智能技术生成

本项目实现了以下功能

  1. 多线程下载漫画
  2. 每一话导出PDF
  3. 合并PDF 并加入Kindle能解析的标签

GitHub链接: GitHub传送门

下面开始分析环节

1. 漫画详情获取

        要下载漫画,首先需要获取全部章节

        打开漫画详情页,可以看到漫画详情URL由这几部分构成

https://manga.bilibili.com/detail/mc25493

无用部分 [ https://manga.bilibili.com/detail/ ] 漫画ID [ mc25493 ]

        因此,在bilibili漫画中,漫画ID用于标识漫画

        

        下一步就是获取全部章节,打开浏览器网络调试,由于bilibili漫画是前后端分离的结构,所以请求类别里面选XHR。

 

        我们在请求列表里可以看到一个 “ComicDetail“ 的请求,点开发现这个请求的epi_list中包含了每一集漫画的”id“,和更多信息。我们现在即可获取每一集的名字,是否购买等方便进一步开发的信息。

2. 下载每一集漫画

        获取到漫画ID后,我们可以进行下载,首先打开漫画阅读界面,再开网络调试,选X

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值