scrapy回调函数传递参数

最新推荐文章于 2024-05-14 15:25:34 发布

置顶流云浅暮

最新推荐文章于 2024-05-14 15:25:34 发布

阅读量2.1k

点赞数

分类专栏：爬虫 Python 文章标签： Python 爬虫

本文链接：https://blog.csdn.net/qq_40176258/article/details/85255146

版权

Python 同时被 2 个专栏收录

20 篇文章 0 订阅

订阅专栏

爬虫

14 篇文章 0 订阅

订阅专栏

在运用scrapy框架进行爬虫时，可能需要将附加数据传递给回调函数，下面将介绍两种向回调函数传递参数的方法。

1.使用 lambda方式传递参数

请求的回调是在下载该请求的响应时将被调用的函数。将使用下载的Response对象作为其第一个参数调用回调函数。

    def parse(self, response):
         a_tag_list = response.css('.list .listtitletxt')
         for element in a_tag_list:
            item = LuboavItem()
            item['title'] = element.css('a::attr("title")').extract()[0]
            item['img_url'] = self.main_url + element.css('a::attr("href")').extract()[0]
            yield scrapy.Request(item['img_url'], callback=lambda response, it=item: self.others_parse(response, it),
                                 dont_filter=True)
            yield item

    def others_parse(self,response,it):
        it['image'] = response.xpath('//p//img/@src').extract()
        yield it

2.在某些情况下，您可能有兴趣将参数传递给那些回调函数，以便稍后在第二个回调中接收参数。您可以使用该Request.meta属性。

def parse_page1(self, response):
    item = MyItem()
    item['main_url'] = response.url
    request = scrapy.Request("http://www.example.com/some_page.html",
                             callback=self.parse_page2)
    request.meta['item'] = item
    yield request

def parse_page2(self, response):
    item = response.meta['item']
    item['other_url'] = response.url
    yield item

文章参考：

https://doc.scrapy.org/en/1.5/topics/request-response.html#passing-additional-data-to-callback-functions

流云浅暮

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
scrapy回调函数传递参数

在运用scrapy框架进行爬虫时，可能需要将附加数据传递给回调函数，下面将介绍两种向回调函数传递参数的方法。1.使用 lambda方式传递参数请求的回调是在下载该请求的响应时将被调用的函数。将使用下载的Response对象作为其第一个参数调用回调函数。 def parse(self, response): a_tag_list = response.css('...
复制链接

扫一扫