使用Python自带的标准库获取历史天气网(http://lishi.tianqi.com)上城市的历史气温数据,需要设置的是city名,这个需要历史天气网查看,以及需要获取的年份和月份。
# -*- coding: utf-8 -*-
"""
@author: CC
"""
import re
import urllib2
import csv
import time
"""
设置需要爬取的地区,使用该地区的拼音
设置需要爬取的年、月
"""
city = 'wuhan'
years = ['2017']
months = ['06', '07', '08','09']
def getHtml(city, year, month):
url = 'http://lishi.tianqi.com/' + city + '/' + str(year) + str(month) + '.html'
print url
request = urllib2.Request(url)
request.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36')
response = urllib2.urlopen(request)
html =