Python爬虫：如何爬取分页数据？

最新推荐文章于 2024-04-30 19:27:32 发布

weixin_30906701

最新推荐文章于 2024-04-30 19:27:32 发布

阅读量6k

点赞数 1

文章标签： python 爬虫开发工具

原文链接：http://www.cnblogs.com/duwangdan/p/6898391.html

版权

上一篇文章《Python爬虫：爬取人人都是产品经理的数据》中说了爬取单页数据的方法，这篇文章详细解释如何爬取多页数据。

爬取对象：

有融网理财项目列表页【履约中】状态下的前10页数据，地址：https://www.yrw.com/products/list-all-all-performance-1-createTimeDesc-1.html

编程思路：

1. 寻找分页地址的变动规律 2. 解析网页，获取内容，放入自定义函数中 3. 调用函数，输出分页内容

详细解说：

1. 首先插入用到的库：BeautifulSoup、requests

1 from bs4 import BeautifulSoup
2 import requests

2. 观察地址的变化规律，可以看到，每切换一页时，后面“createTimeDesc-1.html”中的数字1会随着页面的变动而变动，此时我们将地址存放进列表中，后面用format()和for循环来实现多个地址的存储。

1 urls = ['https://www.yrw.com/products/list-direct-all-performance-1

最低0.47元/天解锁文章

weixin_30906701

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫：如何爬取分页数据？

上一篇文章《Python爬虫：爬取人人都是产品经理的数据》中说了爬取单页数据的方法，这篇文章详细解释如何爬取多页数据。爬取对象：有融网理财项目列表页【履约中】状态下的前10页数据，地址：https://www.yrw.com/products/list-all-all-performance-1-createTimeDesc-1.html编程思路：1. 寻找分页地址的变动规律 2....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。