最近的项目利用机器学习进行分析,对于特征的选取,尝试使用天气相关的数据。
利用pandas,对于得到的过去两三年的天气情况进行处理。
历史天气获取地址:http://tianqi.2345.com/wea_history/71146.htm
此处展现的是上海浦东地区过去两年的天气情况,如下:
由于数据可以直接复制粘贴比爬虫获取要快速,所以直接粘贴到excel中,进行分析。
1.分别读入三年的天气数据,并合并成一张表,代码如下:
#导入三年天气合并
w_2016=pd.read_excel('2016天气.xlsx')
w_2017=pd.read_excel('2017天气.xlsx')
w_2018=pd.read_excel('2018天气.xlsx')
df2=w_2016.append(w_2017).append(w_2018)
表格样式如下:
2.对天气,风向风力,空气质量指数进行详细拆分
拆分为:最好天气,最坏天气,风向,风力,空气质量 等列,具体处理