用python去爬取小说网址的小说保存到本地全过程

最新推荐文章于 2024-07-25 18:55:58 发布

龟仙岛

最新推荐文章于 2024-07-25 18:55:58 发布

阅读量1.2k

点赞数 16

分类专栏： Python基础知识 Python学习日志文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wwwcaifeng/article/details/140593290

版权

我是买了一本书自己看书去学python的，然后学到了一个章节就是讲的用python去某网络小说网址爬取小说保存到本地，结果我看的这本书比较古老，它举例的这个被爬取的网站已经不存在了，所以，我另外找了一个网站，比着摸索着打代码，中间出现过好多不理解的地方，还有好多地方走了弯路，在此重新整理一下这个代码，尽量说详细一些，给后来的学习者们提供一点灵感吧。

一、要实现的效果

就是我们现在在某网络小说网站看到了一篇长篇小说——《渣男文里的攻略女》，它好多个章节，我想要把这部小说里所有的章节内容保存到本地电脑，每个章节保存成一个txt文件。

网页分析，这个小说页包含一个总的目录页，还有各个章节的具体内容页。

二、爬取思路分析

1、涉及的知识点如下。

（1 ）使用 requests获取网页源代码。

（ 2）使用正则表达式获取内容。

（ 3）文件操作，在本地新建文件夹，新建txt文件，写入内容。

上面三个知识点不熟悉的先百度一下吧。

2、代码设计思路

导入用到的模块，
从网站的目录页的源代码里通过正则表达式爬取所有章节的链接保存到列表
从具体的章节内容页爬取章节名和每一章节的具体内容
在本地新建一个文件夹，用章节名命名txt文件，写入爬取到的具体内容

3、写代码

1、第一段代码，先把用到的库导入进来，用到以下四个库，其中requests是需要另外安装的，其它三个是python自带的。

import re
import requests
impor

最低0.47元/天解锁文章

关注

16
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
用python去爬取小说网址的小说保存到本地全过程

我是买了一本书自己看书去学python的，然后学到了一个章节就是讲的用python去某网络小说网址爬取小说保存到本地，结果我看的这本书比较古老，它举例的这个被爬取的网站已经不存在了，所以，我另外找了一个网站，比着摸索着打代码，中间出现过好多不理解的地方，还有好多地方走了弯路，在此重新整理一下这个代码，尽量说详细一些，给后来的学习者们提供一点灵感吧。
复制链接

扫一扫

专栏目录

龟仙岛 CSDN认证博客专家 CSDN认证企业博客

码龄3年

31: 原创

8万+: 周排名

4万+: 总排名

6万+: 访问

: 等级

445: 积分

89: 粉丝

126: 获赞

11: 评论

225: 收藏

私信

关注

热门文章

分类专栏

最新评论

用python去爬取小说网址的小说保存到本地全过程
字节探索者: 总结的很详细，文章有深度，内容丰富，干货满满，感谢博主的分享，期待博主持续更新
【flash】as2.0利用组件制作单选题
Mindy宇小明: 求助，为什么我的单选题代码单独用的时候可以，但是合成之后就出现问题，代码失效了
【flash】as2.0用setInterval实现每隔一段时间执行一次函数
CSDN-Ada助手: 恭喜您写了第19篇博客！看到您能够持续创作让我非常开心。标题中提到了使用setInterval实现定时执行函数，这是一个非常有用的技巧。不过，我想给出下一步的创作建议，希望您能够尝试更深入地探索Flash的其他功能和特性。比如，您可以尝试介绍一些高级的动画效果或交互功能，或者分享一些实用的调试技巧。期待您的下一篇博客，我相信您会有更多精彩的创作！
【flash】as2.0利用组件制作单选题
CSDN-Ada助手: 恭喜作者在第20篇博客中分享了关于利用组件制作单选题的内容，内容相当有价值！希望作者能够继续保持创作热情，不断分享更多关于flash和as2.0的技术经验和心得体会，也可以尝试结合实际案例进行分析和分享，这样更能吸引更多读者的关注和学习。期待作者的下一篇作品！
【flash】as2.0利用flash组件制作多选题
CSDN-Ada助手: 恭喜你写了第18篇博客，标题看起来很有趣！我建议下一步你可以尝试使用更多的实例和案例来说明你的观点，这样读者更容易理解你的想法。期待你的下一篇博客！加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。