scrapy 图片下载

scrapy 图片下载

使用scrapy 下载图片

代码示例

spider.py

import scrapy
from DownloadPhoto.items import DownloadphotoItem

class TupianSpider(scrapy.Spider):
    name = 'tupian'
    allowed_domains = ['daimg.com']
    start_urls = ['http://www.daimg.com/photo/']

    def parse(self, response):
        item = DownloadphotoItem()
        for info in response.xpath("//ul[@class='ibox2_list']/li"):
            item['image_urls'] = info.xpath(".//a/img/@src").extract()#这里传过去的必须是列表,不能是字符串
            item['image_name'] = info.xpath(".//a/text()").extract_first()
            yield item

spider.py主要抓取图片的名字或者链接然后yield这里不做过多讲解

setting.py

ITEM_PIPELINES = {
    'DownloadPhoto.pipelines.ImagePipeline':3 #开启自定义的图片下载管道
   # 'scrapy.pipelines.images.ImagesPipeline':1
}
#名字不能写错
IMAGES_STORE="image" #下载图片的地址 
IMAGE_URLS_FILED="image_urls"#需要下载的图片url字段名 item中定义的名字

setting.py 开启管道 设置下载地址及需要下载的图片字段名

pipeline.py

import re
from scrapy.pipelines.images import ImagesPipeline
from scrapy import Request


class ImagePipeline(ImagesPipeline):
    def get_media_requests(self, item, info):
        for image_url in item['image_urls']:
            yield Request(image_url,meta={"name":item['image_name']})

    # 重命名,若不重写这函数,图片名为哈希,就是一串乱七八糟的名字
    def file_path(self, request, response=None, info=None):
         """
        分文件夹下载
            image_name=request.meta['name']+".jpg"
            filename=request.meta['name']
            # 过滤windows字符串,不经过这么一个步骤,你会发现有乱码或无法下载
            name=re.sub(r'[?\\*|“<>:/]', '', filename)
            filename = u'{0}/{1}'.format(name, image_name)
            return filename
        """
        #上面函数传过来的
        image_name=request.meta['name']
        filename=request.meta['name']
        # 过滤windows字符串,不经过这么一个步骤,你会发现有乱码或无法下载
        name=re.sub(r'[?\\*|“<>:/]', '', filename)+".jpg"
        #{0}匹配的是文件夹的名字  {1}是图片名
        return name


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园2.0是高校信息化建设的新阶段,它面对着外部环境变化和内生动力的双重影响。国家战略要求和信息技术的快速发展,如云计算、大数据、物联网等,为智慧校园建设提供了机遇,同时也带来了挑战。智慧校园2.0强调以服务至上的办学理念,推动了教育模式的创新,并对传统人才培养模式产生了重大影响。 智慧校园建设的解决之道是构建一个开放、共享的信息化生态系统,利用互联网思维,打造柔性灵活的基础设施和强大的基础服务能力。这种生态系统支持快速迭代的开发和持续运营交付能力,同时注重用户体验,推动服务创新和管理变革。智慧校园的核心思想是“大平台+微应用+开放生态”,通过解耦、重构和统一运维监控,实现服务复用和深度融合,促进业务的快速迭代和自我演化。 智慧校园的总体框架包括多端协同,即“端”,它强调以人为中心,全面感知和捕获行为数据。这涉及到智能感知设备、超级APP、校园融合门户等,实现一“码”或“脸”通行,提供线上线下服务端的无缝连接。此外,中台战略是智慧校园建设的关键,包括业务中台和数据中台,它们支持教育资源域、教学服务域等多个领域,实现业务的深度融合和数据的全面治理。 在技术层面,智慧校园的建设需要分期进行,逐步解耦应用,优先发展轻量级应用,并逐步覆盖更多业务场景。技术升级路径包括业务数据化、数据业务化、校园设施智联化等,利用IoT/5G等技术实现设备的泛在互联,并通过人工智能与物联网技术的结合,建设智联网。这将有助于实现线上线下一网通办,提升校园安全和学习生活体验,同时支持人才培养改革和后勤管理的精细化。 智慧校园的建设不仅仅是技术的升级,更是对教育模式和管理方式的全面革新。通过构建开放、共享的信息化生态系统,智慧校园能够更好地适应快速变化的教育需求,提供更加个性化和高效的服务,推动教育创新和人才培养的高质量发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值