#私藏项目实操分享#Python爬虫实战,requests模块,Python实现爬取网站漫画

本文介绍了使用Python爬虫实战抓取网站漫画的过程,主要涉及requests、re和shutil模块。首先分析思路,找到图片链接并通过开发者工具抓包获取数据包,然后解析数据包提取漫画的唯一标识和翻页参数。最后展示了关键代码实现及数据保存。
摘要由CSDN通过智能技术生成

前言

今天带大家爬取爬取网站漫画,废话不多说,直接开始~

开发工具

Python版本:3.6.4

相关模块:

requests模块;

re模块;

shutil模块;

以及一些Python自带的模块。

python学习资源 需要的自取腾讯文档-在线PDFhttps://docs.qq.com/pdf/DR3dMaE1CSkZ6RlBZ

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

思路分析

漫画其实是一张一张图片来着,所以我们先找到这些图片的链接在哪里!因为本文是为了实现想看什么漫画就爬取什么漫画,所以搜索任一漫画,这里以神印王座为例,然后点进去进入详情页查看任一话;在浏览页中,网页源代码是没有我们需要的数据,所以需要打开开发者工具进行抓包,最终成功找到图片的链接。

找到图片链接后,接着就要想办法从该数据包中获取,也就是访问该数据包的链接,从数据包中提取图片链接。通过多页的数据包,观察以下数据包链接,发现 chapter_newid 每次翻页会发生变化的, comic_id 是一本漫画的唯一标识。

https://www.kanman.com/api/getchapterinfov2?product_id=1&productname=kmh&p
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值