爬虫-Scrapy（三）翻页的实现

最新推荐文章于 2022-12-07 23:30:03 发布

荆棘谷三季稻

最新推荐文章于 2022-12-07 23:30:03 发布

阅读量3k

点赞数 4

分类专栏：爬虫-Scrapy 文章标签：爬虫

本文链接：https://blog.csdn.net/XiaoDao147258369/article/details/114448628

版权

本文介绍了如何在Scrapy中实现翻页功能，通过查找并跟随'下一页'按钮的href，回调parse方法实现循环爬取，直到没有下一页链接。此外，还展示了将爬取的数据导出到CSV文件的方法。

摘要由CSDN通过智能技术生成

1. 翻页的实现

上一篇实现了单页的爬取，再加3行代码就可以实现翻页了。

基本思路是查找页面中‘下一页’按钮对应的href地址，然后回调parse方法实现循环，直至找不到’下一页’的链接为止。

QiubaiSpider.py

import scrapy
import re
from scpy1.items import Scpy1Item

class Qiubai1Spider(scrapy.Spider):
    name = 'qiubai1'
    allowed_domains = ['qiushibaike.com'

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

荆棘谷三季稻

关注关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
爬虫-Scrapy（三）翻页的实现

1. 翻页的实现上一篇实现了单页的爬取，再加3行代码就可以实现翻页了。基本思路是查找页面中‘下一页’按钮对应的href地址，然后回调parse方法实现循环，直至找不到’下一页’的链接为止。QiubaiSpider.pyimport scrapyimport refrom scpy1.items import Scpy1Itemclass Qiubai1Spider(scrapy.Spider): name = 'qiubai1' allowed_domains = ['qiu
复制链接

扫一扫