importcsvimportsysimporturllib.requestfrom bs4 import BeautifulSoup #解析页面模块
importpygalimportcityinfo
cityname= input("请输入你想要查询天气的城市:")if cityname incityinfo.city:
citycode=cityinfo.city[cityname]else:
sys.exit()
url= '非常抱歉,网页无法访问' + citycode + '.shtml'header= ("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36") #设置头部信息
http_handler=urllib.request.HTTPHandler()
opener= urllib.request.build_opener(http_handler) #修改头部信息
opener.addheaders=[header]
request= urllib.request.Request(url) #制作请求
response= opener.open(request) #得到应答包
html= response.read() #读取应答包
html= html.decode('utf-8') #设置编码,否则会乱码
#根据得到的页面信息进行初步筛选过滤
final= [] #初始化一个列表保存数据
bs= BeautifulSoup(html, "html.parser") #创建BeautifulSoup对象
body=bs.body
data= body.find('div', {'id': '7d'})print(type(data))
ul= data.find('ul')
li= ul.find_all('li')#爬取自己需要的数据
i= 0 #控制爬取的天数
lows= [] #保存低温
highs= [] #保存高温
daytimes= [] #保存日期
weathers= [] #保存天气
for day in li: #便利找到的每一个li
if i < 7:
temp= [] #临时存放每天的数据
date= day.find('h1').string #得到日期
#print(date)
temp.append(date)
daytimes.append(date)
inf= day.find_all('p') #遍历li下面的p标签 有多个p需要使用find_all 而不是find
#print(inf[0].string) # 提取第一个p标签的值,即天气
temp.append(inf[0].string)
weathers.append(inf[0].string)
temlow= inf[1].find('i').string #最低气温
if inf[1].find('span') is None: #天气预报可能没有最高气温
temhigh=None
temperate=temlowelse:
temhigh= inf[1].find('span').string #最高气温
temhigh= temhigh.replace('℃', '')
temperate= temhigh + '/' +temlow#temp.append(temhigh)
#temp.append(temlow)
lowStr= ""lowStr=lowStr.join(temlow.string)
lows.append(int(lowStr[:-1])) #以上三行将低温NavigableString转成int类型并存入低温列表
if temhigh isNone:
highs.append(int(lowStr[:-1]))
highStr= ""highStr=highStr.join(temhigh)
highs.append(int(highStr))#以上三行将高温NavigableString转成int类型并存入高温列表
temp.append(temperate)
final.append(temp)
i= i + 1
#将最终的获取的天气写入csv文件
with open('weather.csv', 'a', errors='ignore', newline='') as f:
f_csv=csv.writer(f)
f_csv.writerows([cityname])
f_csv.writerows(final)#绘图
bar= pygal.Line() #创建折线图
bar.add('最低气温', lows)
bar.add('最高气温', highs)
bar.x_labels=daytimes
bar.x_labels_major= daytimes[::30]#bar.show_minor_x_labels = False # 不显示X轴最小刻度
bar.x_label_rotation= 45bar.title= cityname+'未来七天气温走向图'bar.x_title= '日期'bar.y_title= '气温(摄氏度)'bar.legend_at_bottom=True
bar.show_x_guides=False
bar.show_y_guides=True
bar.render_to_file('temperate.svg')