爬取快看漫画#python-爬虫

故事未完pre

已于 2023-11-29 07:38:59 修改

阅读量1.1k

点赞数 9

文章标签：爬虫

于 2023-11-29 07:38:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64636822/article/details/130775167

版权

思路：如何获取章节链接，生成获取章节列表（生成的代码中的href属性=章节列表）
首先选取一篇漫画，点击任意章节：查看url中的路径为/web/comic/540156/
/web/comic/540156/应为章节链接

在network中查找/web/comic/540156/，只有一个herf属性为/web/comic/540156/链接。但并不是第一章漫画的接口，而是查看第一话的接口。因为只有一个/web/comic/540156/链接，因此起源这一章节的链接可能为动态添加上得到链接。

在element中查找/web/comic/540156/，有两个herf属性为/web/comic/540156/链接

找到章节名，起源外面的span标签与源码中的span标签对应，那span标签外的a标签

<a href="javascript:void(0);" target="">，在herf标签中加入javascript:void(0)，意为：点击不发生任何跳转或事件。void，无返回值；0为赋予的形参，javascript:意为javascript的代码。点击调用void的函数，不发生任何事件。但是点击浏览器中的起源，会发生跳转。

当在页面中存在，但在源码中不存在的链接通常使用js代码动态生成。此行代码为当前互联网上常用的反爬手段。如果想要获取信息一定要有解析js代码的能力。因为章节id不可以凭空捏造，若为凭空捏造，那么发送给服务器，服务器不会理解意思，所以一定是有迹可循的，通常来说章节id为一个固定值，方便在数据库中查找数据。因此寻找章节id生成的位置。

双击引号部分，为可编辑状态，就可以复制章节id。

第一章的章节id为/web/comic/540156/中的540156，使用全局搜索540156，有两条信息。因为

页面源码中还有一各位置有第一章的链接。

第二章的章节id为/web/comic/542974/中的542974，使用全局搜索542974，只有一条信息

ctrl+F在请求中查找，很多情况下，（章节id）是通过本地js文件生成。全局搜索将本地的js文件以及网页上获取的js文件都找到。

故事未完pre

博客等级

码龄3年

19
原创

136
点赞

152
收藏

101
粉丝

关注

私信

热门文章

最新评论

ubuntu20.04下载软件无法定位软件包
梦里贪欢131: 关于这个能再写的详细一点吗？
大小端存储
CSDN-Ada助手: 恭喜作者能够持续不断地创作博客，而且这一篇关于大小端存储的博文内容也十分有趣。不过在下觉得，或许可以考虑在下一篇博客中，加入一些具体的例子或者应用场景，让读者更容易理解和接受这个概念。希望作者能够继续努力，不断提高自己的创作水平，期待更多精彩的内容！
自增操作符的表达式
CSDN-Ada助手: 恭喜您写了第16篇博客！看到您对自增操作符的表达式进行了深入的探讨，我感到非常欣慰。希望您能继续保持创作的热情和动力，让更多的人受益于您的知识分享。如果可以的话，我建议您可以尝试写一些实际案例的分析，或者是结合其他编程语言的比较，这样可以让读者更加全面地了解该主题。期待您的下一篇博客！
scanf函数读入字符串遇到空格停止
CSDN-Ada助手: 恭喜您写了第17篇博客！不断分享知识和经验是非常值得称赞的。关于scanf函数读入字符串遇到空格停止这个话题，您已经做得很好了。接下来，建议您可以尝试深入探讨scanf函数在不同情况下的应用，或者分享一些实际案例来帮助读者更好地理解。希望您能继续坚持写作，期待您更多精彩的内容！
数组指针对数组元素的引用
CSDN-Ada助手: 恭喜用户发布了第14篇博客！标题“数组指针对数组元素的引用”非常吸引人，内容也十分有深度。希望您能继续保持写作的热情和创作的灵感，不断分享有价值的知识和见解。建议您在下一篇博客中可以探讨一些实际案例，或者结合具体的编程语言来展示数组指针的使用技巧，这样会更具启发性和实用性。期待您的下一篇作品！继续加油！

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。