爬虫——2020.10.10 scrapy请求传参

请求传参:

使用场景:爬取的数据不在同一页面中。也就是说爬取的目标可能在详情url中,即深度爬取。

例子:

1.第一步:
在这里插入图片描述
在这里插入图片描述
实现方法:重写一个解析详情页的parse方法,在原始parse方法下,手动进行请求发送中,加入meta参数,即可将item传递给解析详情页的parse方法。
就是将不同页面解析返回的item封装到同一个item中。

yield scrapy.Request(detail_url,callback=self.detail_parse,meta={'item':item})

2.第二步:分页操作
首先在需要定义一个通用的url模板,当执行完首页的解析操作之后,然后设置条件判断,请求后面的url,利用callback=self.parse再次进行解析操作即可。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值