使用Scrapy框架爬取历史天气数据

#爬取主程序

# -*- coding: utf-8 -*-
import scrapy
from scrapy import Request
from ..items import SpainweatherItem
class SpainSpider(scrapy.Spider):
    #爬取2016年西班牙的天气数据
    name = 'Spain'
    allowed_domains = ['www.mundomanz.com']
    start_urls = ['http://www.mundomanz.com/']
    def parse(self, response):
        year = 2016
        #判断每月的天数,爬取每天的历史天气数据
        for month in range(1, 13):
            if month == 2:
                for day in range(1, 29):
                    if day<10:
                        base_url = 'http://www.mundomanz.com/meteo_p/mairtext?' \
                                   'year=' + str(year) + '&month=0' + str(month) + '&day=0' + str(
                            day) + '&n_days=1&action=display'
                    else:
                        base_url = 'http://www.mundomanz.com/meteo_p/mairtext?' \
                                   'year=' + str(year) + '&month=0' + str(month) + '&day=' + str(
                            day) + '&n_days=1&action=display'
                    print base_url
                    yield Request(base_url,callback=self.saveData)
            if month in [4,6,9,11]:
                if month<10:
                    for day in range(1, 31):
                        if day < 10:
                            base_url = 'http://www.mundomanz.com/meteo_p/mairtext?' \
                                        'year=' + str(year) + '&month=0' + str(month) + '&day=0' + str(
                                day) + '&n_days=1&action=display'
                        else:
                            base_url
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值