本文以2019年全国各城市的空气质量观测数据为例,利用matplotlib、calmap、pyecharts绘制日历图和热力图。在绘图之前先利用pandas对空气质量数据进行处理。
2019年全国各城市空气质量观测数据来源于:https://beijingair.sinaapp.com。
数据处理
从网站下载的数据为逐小时数据,每天一个文件。如果要绘制全年的日历图或者热图,首先要将所有的数据进行合并处理。
下载好数据之后,将数据解压到当前目录的2019文件夹内,然后处理数据:
import globfrom datetime import datetime, timedeltaimport numpy as npimport pandas as pdfrom matplotlib import cm, colorsimport matplotlib.dates as mdatesimport matplotlib.patches as mpatchesimport matplotlib.pyplot as pltdef format_aqi(filep, columns=None): files = glob.glob(filep) df = pd.concat((pd.read_csv(f) for f in files)) df.index = pd.to_datetime(df.date.astype(np.str) + df.hour.apply(lambda x: '%02d'%x), format='%Y%m%d%H') # drop date and hour columns df.drop(['date', 'hour'], axis=1, inplace=True) df = df.pivot_table(columns='type', index=df.index) df.columns.names = ['station', 'type'] df.index.names = ['date'] df = df.stack('station') if columns is not None: df = df.loc[:, columns] return dffilep = '2019/china*.csv' data = format_aqi(filep)data.csv('2019.csv') # 保存以便后续使用
合并完成数据后,读取数据并进一步处理:
data = pd.read_csv('2019.csv', index_col=&#