python:利用scrapy爬取图片

本文介绍如何用Python的Scrapy框架爬取并下载图片,包括创建工程、定义Spider、设置Item、编写Pipeline和调整Settings,最终实现图片的分组下载。爬取的图片已做马赛克处理。
摘要由CSDN通过智能技术生成

python:利用scrapy爬取图片,爬取的图片为福利图片,程序都带有详细注释,就不再过多码字

1.创建工程

scrapy startproject beautifulgirl

2.在spiders文件里创建属于属于自己的spider文件

在这里插入图片描述

3.设置item

import scrapy
#图片下载管道

class BeautifulgirlItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    image_name=scrapy.Field()
    image_urls=scrapy.Field()
    images=scrapy.Field()
    referer=scrapy.Field()
    pass

先去网页踩点
找到图片所在的类

在这里插入图片描述

4.编写Spiders

import scrapy
from beautifulgirl.items import BeautifulgirlItem

class ImgspiderSpider(scrapy.Spider):
    name='girl'                                           #名字唯一,用于爬取
    allowed_domains=['www.mm131.net']                     #设置过滤爬取的域名,插件OffsiteMiddleware启用的情况下(默认是启用的),不在此允许范围内的域名就会被过滤,而不会进行爬取
    start_urls=['https://www.mm131.net/xinggan/',         #爬取的链接,这里将首页一行的标题链接都放进去了
                'https://www.mm131.net/qingchun/',
                'https://www.mm131.net/xiaohua/',
                'https://www.mm131.net/chemo/',
                'https://www.mm131.net/qipao/',
                'https://www.mm131.net/mingxing/'
        ]
    def parse(self,response):                             #编写回调函数
        l
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值