Scrapy ImagesPipeline下载图片

最新推荐文章于 2024-05-16 11:47:28 发布

未来，值得期待

最新推荐文章于 2024-05-16 11:47:28 发布

阅读量1k

点赞数 1

分类专栏： python 文章标签： Scrapy ImagesPipelin

本文链接：https://blog.csdn.net/adam_wzs/article/details/78856701

版权

python 专栏收录该内容

30 篇文章 2 订阅

订阅专栏

项目源码下载：http://download.csdn.net/download/adam_zs/10166641

1.项目结构，下载图片截图

2.项目简介

settings.py

ITEM_PIPELINES = {
    # 'scrapy.pipelines.images.ImagesPipeline': 1
    "ImagesPipelineTest.pipelines.MyImagesPipeline":1
}
IMAGES_STORE = 'E:\\shetuwang2017'

items.py

import scrapy


class ImageItem(scrapy.Item):
    image_urls = scrapy.Field()
    images = scrapy.Field()
# image_urls和images是固定的

she_tu_wang.py

# -*- coding: utf-8 -*-
import scrapy
from ImagesPipelineTest.items import ImageItem


class XiaohuaSpider(scrapy.Spider):
    name = "shetuwang"
    allowed_domains = ["699pic.com"]
    start_urls = ['http://699pic.com/people.html']
    download_delay = 2

    def parse(self, response):
        item = ImageItem()
        srcs = response.xpath('//div[@class="swipeboxEx"]/div[@class="list"]/a/img/@data-original').extract()
        item['image_urls'] = srcs
        yield item

pipelines.py

from scrapy.pipelines.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy.http import Request


class MyImagesPipeline(ImagesPipeline):

    def get_media_requests(self, item, info):
        for image_url in item['image_urls']:
            yield Request(image_url)

    def item_completed(self, results, item, info):
        image_path = [x['path'] for ok, x in results if ok]
        if not image_path:
            raise DropItem('Item contains no images')
        item['image_paths'] = image_path
        return item

3.运行项目

pycharm中运行begin.py

from scrapy import cmdline

# cmdline.execute("scrapy crawl dmoz".split())

cmdline.execute("scrapy crawl shetuwang".split())

未来，值得期待

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Scrapy ImagesPipeline下载图片

Scrapy ImagesPipeline下载图片Scrapy ImagesPipeline下载图片
复制链接

扫一扫

专栏目录

Scrapy ImagesPipeline下载图片

1.项目结构，下载图片截图

2.项目简介

3.运行项目

“相关推荐”对你有帮助么？