Scrapy框架自定义pipeline两层下载路径去下载图片，关于item传值的问题

最新推荐文章于 2021-11-04 11:28:56 发布

cp_123321

最新推荐文章于 2021-11-04 11:28:56 发布

阅读量643

点赞数

文章标签： scrapy 框架自定义pipeline 下载图片 item的传值

本文链接：https://blog.csdn.net/cp_123321/article/details/84675034

版权

本文介绍了如何在Scrapy框架中自定义pipeline实现两层路径下载图片，详细讲解了items.py、settings.py和pipelines.py中的关键代码，并通过链接分享了一个具体的实现案例，帮助读者理解item值传递的过程。

摘要由CSDN通过智能技术生成

自定义两层路径的时候，item是需要经过传值的，爬虫函数如下

import scrapy
from urllib.request import urljoin
from ..items import OffmymindspiderItem
class OffmymindSpider(scrapy.Spider):
    name = 'offmymind'
    allowed_domains = ['www.biaobaiju.com']
    start_urls = ['http://www.biaobaiju.com/']

    def parse(self, response):
        """
        获取每个分类的地址和分类的名称
        :param response:
        :return:
        """
        a_list = response.xpath("//ul[@class='nav clearfix']/li/a")
        for a in a_list:
            img_type_url = a.xpath("@href").extract_first("")
            img_type_name = a.xpath("text()").extract_first("")
            yield scrapy.Request(url=img_type_url, dont_filter=False, callback=self.parse_img_type_info, meta={"img_type_name":img_type_name})

    def parse_img_

最低0.47元/天解锁文章

cp_123321

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
Scrapy框架自定义pipeline两层下载路径去下载图片，关于item传值的问题

自定义两层路径的时候，item是需要经过传值的，爬虫函数如下import scrapyfrom urllib.request import urljoinfrom ..items import OffmymindspiderItemclass OffmymindSpider(scrapy.Spider): name = 'offmymind' allowed_domai...
复制链接

扫一扫