python爬去中国天气网_爬取中国天气网

本文介绍了如何使用Python爬虫从中国天气网获取历史天气数据。通过分析40天预报的URL模式,构造月份URL,利用requests库获取JSON数据,再解析并保存到CSV文件中。主要步骤包括:确定入口URL、构造年月URL、提取和保存数据。
摘要由CSDN通过智能技术生成

思路:

1.寻找入口

2.寻找数据所在url

3.获取源码,提取数据

4.数据保存输出

1.入口

入口

通过40天预报可以追溯2016年和2017年全年的天气数据。

2.构造url

分析可知40天的天气数据是通过js异步加载,每个月份对应一个url

url

url由年份和月份组成,我们可以根据这个规律构造url,循环抓取数据

month = ['01','02','03','04','05','06','07','08','09','10','11','12']

for i in month:

url = 'http://d1.weather.com.cn/calendar_new/'+str(year)+'/101180101_'+str(year)+str(i)+'.html?_=1496558858156'

3.数据提取

请求url获取的数据是json格式,稍加处理转换为列表,方便提取所需数据。

数据

html 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值