11、一个简单的更美APP美购项目爬虫

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://www.gmei.com/promotion_list/province_268?page=1',
    ]

    def parse(self, response):
        for quote in response.css('a.commodity'):
            yield {
                'title': quote.css('p.commodity-title::text').extract(),
                'yuyue':quote.css('div.commodity-num span').re(r'[1-9]\d*'),
                'riji':quote.css('span.diary-num').re(r'[1-9]\d*'),
                'xianjia':quote.css('h3.commodity-price').re(r'[1-9]\d*')[1],
                'yuanjia':quote.css('h3.commodity-price').re(r'[1-9]\d*')[2],
                'address':quote.css('p.commodity-address::text').extract(),
                'url': quote.css('a.commodity::attr(href)').extract(),
            }

        next_page = response.css('li.next-page a::attr(href)').extract_first()
        if next_page is not None:
             next_page = response.urljoin(next_page)
        yield scrapy.Request(next_page, callback=self.parse)
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值