Python爬虫 - 爬取豆瓣读书TOP250电子书

You are handsome

于 2020-05-04 02:25:55 发布

阅读量1.9k

点赞数

本文链接：https://blog.csdn.net/weixin_46336017/article/details/105911736

版权

本文介绍了如何使用Python爬虫抓取豆瓣读书的TOP250书籍列表，并详细解析了翻页爬取的规律以及如何向熊猫搜书网站发送POST请求获取电子书资源。最后提供了完整的源代码链接。

摘要由CSDN通过智能技术生成

1.爬取思路

访问豆瓣读书top250，并提取书籍名称。
把提取的书籍名称，放到搜书网站(本文使用的是熊猫搜书)。
把搜索的结果保存到本地。(底部有保存的文本文件，需要自提）

2.重点解析

1.豆瓣翻页爬取规律

实例代码：

#第一页网址，共10页，每页25个标题
url = "https://book.douban.com/top250?start=0"

#翻页只需更改索引，可用for循环遍历
for index in range(0,226,25):
	print("https://book.douban.com/top250?start=" + str(index))

#运行结果
https://book.douban.com/top250?start=0
https://book.douban.com/top250?start=25
https://book.douban.com/top250?start=50
https://book.douban.com/top250?start=75
https://book.douban.com/top250?start=100
https://book.douban.com/top250?start=125
https://book.douban.com/top250?start=150
https://book.douban.com/top250?start=175
https://book.douban.com/top250?start=200
https://book.douban.com/top250?start=

最低0.47元/天解锁文章

You are handsome

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫 - 爬取豆瓣读书TOP250电子书

1.爬取思路访问豆瓣读书top250，并提取书籍名称。把提取的书籍名称，放到搜书网站(本文使用的是熊猫搜书)。把搜索的结果保存到本地。2.重点解析1.豆瓣翻页爬取规律#第一页网址，共10页，每页25个标题url = "https://book.douban.com/top250?start=0"#翻页只需更改索引，可用for循环遍历for index in ra...
复制链接

扫一扫