10行Python代码,采集笔趣阁小说!

本文介绍如何使用Python进行网络爬虫,以笔趣阁小说《超神机械师》为例,通过导入requests和re库,解析小说详情页URL,提取章节链接并访问获取内容,最终将小说保存到文档中。
摘要由CSDN通过智能技术生成

需要的导入的包:

import requests
import re

爬取笔趣阁小说:

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!??¤
QQ群:961562169

https://www.biquge.com.cn/

最近在看《超神机械师》就以这个为例分析爬取代码

先到小说的详情页面:

https://www.biquge.com.cn/book/29105/

检索之后可以发现每章小说的网址:


用re.findall 获取这些网址保存起来待用:


因为这些网址只是后半部分,我们可以加上后半部分,访问章节网址,获取小说:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值