用Python爬取小说《完美世界》

u010938787

于 2020-05-10 13:56:40 发布

阅读量742

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/u010938787/article/details/106035227

版权

Python爬取小说《完美世界》

由于是新手，Python刚入门不久，写的不好之处，还请各大神谅解。
这里参考了大神的博客：Python每日一练(18)-抓取小说目录和全文
首先打开需要爬取得小说地址：完美世界
打开网址后如下图：在这里插入图片描述

通过分析网页代码，如上图所示：发现所有章节在div id="list"的下面，代码如下。

def get_info(url):
	response = requests.get(url,headers=headers)
	response.encoding = 'utf-8'
	get_info_list = []
	html = etree.HTML(response.text)
	dd_list = html.xpath('//*[@id="list"]/dl/dd')
	for dd in dd_list:
		title = dd.xpath('a/text()')[0]
		href = 'http://www.biquku.la/0/35/' + dd.xpath('a/@href')[0]
		chapter = {
   'title':title,'href':href}
		get_info_list

最低0.47元/天解锁文章

u010938787

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
用Python爬取小说《完美世界》

Python爬取辰东大神的《完美世界》由于是新手，Python刚入门不久，写的不好之处，还请各大神谅解。这里参考了大神的博客：Python每日一练(18)-抓取小说目录和全文(https://blog.csdn.net/xw1680/article/details/106025946)首先打开需要爬取得小说地址：笔趣阁(http://www.biquku.la/0/35/)打开网址后如下图：通过分析网页代码，如下图所示：发现所有章节在‘’的下面。![在这里插入图片描述](https://img
复制链接

扫一扫