第一篇爬虫——爬取一本小说

CatalinaCatherine

已于 2023-09-15 21:21:33 修改

阅读量1.6k

点赞数 4

分类专栏： python 文章标签：爬虫

于 2023-09-15 21:16:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74830349/article/details/132898296

版权

目录

一、爬取第一章

1.引入requests 和 parsel库

2.代码实现步骤：

(1).发送请求

(2).获取数据

(3).解析数据

提取章节名

使用 css 获取小说标题，粘贴：

使用 xpath 也可以获取小说标题

提取小说内容

(4).保存数据

二、爬取整本小说

一、爬取第一章

1.引入requests 和 parsel库

import requests
import parsel

如果requests 和 parsel报错，单击requests再按Alt+Enter，Install package requests。

单击parsel再按Alt+Enter，Install package parsel。

依然报错可以使用pip命令安装requests和parsel模块

pip install requests

pip install parsel

可以查看Python中安装了哪些第三方库

pip list

2.代码实现步骤：

(1).发送请求，对于刚刚分析得到的url地址发送请求
(2).获取数据，获收服务器返回的response响应数据
(3).解析数据，提取我们想要的数据内容小说章节名字以及小说内容
(4).保存数据，把提取出来的内容保存到本地

(1).发送请求

小说第一章导航栏地址：

用response变量接收返回的内容

url = 'http://www.ibiquge.cc/19666/5687111.html'
response= requests.get(url) # <Response[200]>返回response响应对象，200表示请求成功
print(response)

(2).获取数据

print(response.text)

最低0.47元/天解锁文章

CatalinaCatherine

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
第一篇爬虫——爬取一本小说

如果requests 和 parsel报错，单击requests再按Alt+Enter，Install package requests。单击parsel再按Alt+Enter，Install package parsel。依然报错可以使用pip命令安装requests和parsel模块可以查看Python中安装了哪些第三方库pip list。
复制链接

扫一扫

专栏目录

CatalinaCatherine CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

129万+: 周排名

21万+: 总排名

1万+: 访问

: 等级

162: 积分

15: 粉丝

31: 获赞

10: 评论

85: 收藏

私信

关注

热门文章

分类专栏

运维 4篇
Linux 4篇
python 3篇
软件 1篇
java 1篇

最新评论

Linux修改hadoop配置文件及启动hadoop集群详细步骤
zqjjjjjj: 启动hadoop之后发现有个配置文件出错了，返回重新修改之后对所有节点都修改，但重新运行之后还是原来的问题，请问博主该怎么解决呢
python奇葩问题：IndexError: list index out of range
CSDN-Ada助手: 恭喜你写了第5篇博客！看到你遇到的Python问题，我觉得你的经验真的很丰富。不过，如果可能的话，我觉得你可以尝试写一些关于解决Python常见问题的技巧或者分享一些实用的Python库的文章，这样可以帮助更多的人解决问题。希望能看到你更多的精彩内容，加油！
python爬取CSDN文章并保存为pdf文档
CSDN-Ada助手: 恭喜您成功写出了这篇关于python爬取CSDN文章并保存为pdf文档的博客！您的技术分享对于许多学习者来说都是非常有帮助的。接下来，如果可能的话，我建议您可以尝试分享一些关于如何利用python进行数据分析或者机器学习的内容，这些都是现在非常热门的领域，也能够吸引更多读者。期待您更多的精彩内容！
wkhtmltopdf安装
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您分享关于wkhtmltopdf安装的经验，让我对这个工具有了更深入的了解。希望您可以继续保持创作的热情，并且可以考虑分享一些关于使用wkhtmltopdf的实际案例或者进阶技巧，这样可以让更多的读者受益。谢谢您的分享，期待您更多的精彩内容！
动环基础(一)
CSDN-Ada助手: 恭喜您写了第13篇博客，标题为“动环基础(一)”，非常高兴看到您持续创作。对于动环基础的探索，我觉得您可以考虑在下一篇博客中加入一些具体的案例分析或者实践经验，这样可以更好地帮助读者理解和应用这些知识。希望能够看到更多精彩的内容，加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。