爬取网站全本小说（超详细版）~已更新完毕

置顶

不知道要起什么昵称

已于 2024-06-01 12:26:14 修改

阅读量1k

点赞数 30

文章标签： python 开发语言大数据 https 网络协议

于 2024-03-18 20:08:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_54030651/article/details/136819213

版权

本文详细介绍了如何使用Python爬虫抓取全本小说，以《重生后我拒绝了校花和青梅》为例，讲解了安装所需库、发送HTTP请求、解析HTML、多线程爬取及文件合并的全过程。

摘要由CSDN通过智能技术生成

目录

1、1 爬取任务和爬取的网站：

1、点击这个链接，https://www.bqghi.cc/id/148332，跳转到如下图：

2、在IJ里新建一个.py文件，如下图：

3、在IJ里安装一些需使用库的包

2、2 正式开始爬取

1、1 爬取任务和爬取的网站：

在此网站上，对任意一本小说全本爬取下来，并存储到电脑某个文件夹里；在这里我以“重生后我拒绝了校花和青梅”这本小说为例，进行详细演示操作，若有不详细的地方，欢迎友友们留言评论，我会与友友们互动的：

1、点击这个链接，https://www.bqghi.cc/id/148332，跳转到如下图：

2、在IJ里新建一个.py文件，如下图：

3、在IJ里安装一些需使用库的包

pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install bs4 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install datetime -i https://pypi.tuna.tsinghua.edu.cn/simple

pip i

最低0.47元/天解锁文章

不知道要起什么昵称

关注

30
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬取网站全本小说（超详细版）~已更新完毕

在做数据抓取前我们可以从以下几方面来入手：1.了解HTML和网页结构2.安装和导入相关依赖库3.发送http请求获取网页内容4.解析HTML网页内容5.定位内容和提取数据6.保存抓取的数据。
复制链接

扫一扫

不知道要起什么昵称 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

116万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

733: 积分

491: 粉丝

538: 获赞

19: 评论

351: 收藏

私信

关注

热门文章

分类专栏

Python实战演练分享 3篇

最新评论

在VM虚拟机上安装普华桌面操作系统Linux4.0和Ubuntu-18.04.6桌面操作系统（超详细版），附有下载网址
z3265630062: Ubuntu的可以正常启动，但是普华的那个一直卡死，重启好几次还是卡死，这是什么原因呢
在VM虚拟机上安装普华桌面操作系统Linux4.0和Ubuntu-18.04.6桌面操作系统（超详细版），附有下载网址
z3265630062: 博主大大你好，我点击链接下载的镜像在虚拟机启动时总是卡死，这是什么情况啊
jdk和Eclipse软件安装与配置（保姆级别教程）
CSDN-Ada助手: 恭喜您发布了第16篇博客！看了您的“jdk和Eclipse软件安装与配置”这篇文章，感觉就像是在跟着您的“保姆级别教程”一步步学习，收获颇丰。希望您能继续坚持创作，分享更多有用的内容给大家。如果可能的话，下一步可以考虑写一些实战经验或者深入解析相关主题的文章，让读者更深入地了解相关知识。期待您的下一篇作品！
Hive组件的搭建（超详细版来了）
CSDN-Ada助手: 恭喜您发布了第14篇博客，“Hive组件的搭建（超详细版来了）”！您的文章内容详实，让读者受益匪浅。希望您能继续保持写作的热情和耐心，为大家分享更多有价值的内容。下一步，可以考虑深入探讨Hive组件的优化和应用场景，或是分享一些实际案例和经验教训，相信会更受读者欢迎。期待您的下一篇精彩作品！
Hadoop和zookeeper集群相关执行脚本（未完，持续更新中~）
CSDN-Ada助手: 恭喜您写了第15篇博客！看到您在分享Hadoop和zookeeper集群相关执行脚本的文章，我感到非常兴奋。希望您能继续保持创作的热情和努力，持续更新这个系列的内容。下一步，我建议您可以探讨一些实际应用场景下的解决方案，或者深入研究一些高级技巧和优化方法。期待您的更多精彩内容，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不知道要起什么昵称 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。