目录
2.An air quality forecasting model based on improved convnet and RNN
3.A time series forecasting based multi-criteria methodology for air quality prediction
模型变化类
1.Multi-hour and multi-site air quality index forecasting in Beijing using CNN, LSTM, CNN-LSTM, and spatiotemporal clustering
基于CNN、LSTM、CNN-LSTM和时空聚类的北京市多小时多站点空气质量指数预测
摘要
利用基于时空聚类的深度学习网络模型建立北京市空气质量的多时间、多站点预测模型,并将其与反向传播神经网络(BPNN)进行比较。在整体预测中,反向传播神经网络(BPNN)、卷积神经网络(CNN)、长短期记忆(LSTM)模型和CNN-LSTM模型的下,小时预测性能依次递增,其中LSTM模型是多小时预测的最优模型。与整体预测相比,季节性预测的表现没有明显改善。对于基于空间聚类的预测,聚类2的预测总体上优于聚类1和整体预测。总体而言,无论是基于季节的还是基于空间聚类的预测都更适合改进某一季节或聚类的预测。在模型类型上,CNN-LSTM和LSTM的性能普遍优于CNN和BPNN。
数据
空气质量数据由中国国家环境监测中心收集,包括2015年1月1日至2016年12月31日北京12个国家环境空气质量监测点每小时的PM2.5、PM10、SO2、NO2、O3、CO。从中国气象数据服务中心收集的气象数据包括每小时的降水、温度、露点、压力、风速和风向(角度)。气象数据来源于离空气质量监测点最近的国家气象站。
时空数据包括3类空间数据(空气质量地面监测站点的经纬度、站点到北京市中心天安门的距离)和3类时间数据(各监测站点的季节、工作日指数和小时时间)。工作日指数使用1(周一至周五)或0(周六和周日)表示。
为了消除量纲差异的影响,提高模型的收敛速度,将所有数据通过以下Min-Max比例方程转换到[0,1]范围
评估标准
为了验证模型的泛化能力,将数据集分为训练集(前70%)和验证集(后30%)。采用均方根误差(RMSE)和一致性指数(IA)评价预测模型的性能。RMSE对观测值和预测值之间的最大或最小误差很敏感。RMSE越低,误差越小。IA表示观测值与预测值的分布相似性。IA在[0,1]范围内变化。IA越接近1,分布一致性越高。
特点
1.在空间维度上,采用Kriging插值和Moran’s I统计分析,将12个监测点分为两个聚类(Moran’s I统计量表示一个变量的空间相关性。)
2. 时间维度上,由于北京地区空气质量指数随季节变化而变化,因此将所有数据按季节分为4个聚类
3.cnn-lstm
本研究采用的CNN-LSTM包括几个过程。以n个站点近t小时的m ×c变量作为输入数据。输入维度与CNN相同,为t ×m ×n ×c,即6 ×6 ×12 ×3。保留CNN的输入层、卷积层和池化层,提取输入数据的特征。将得到的特征平展成一维数组,并以时间序列的形式输入到LSTM层,分析输入数据的时间序列特征。最后,通过全连接层和输出层得到接下来t’小时n个站的AQIs
总结
1.对AQI空间分布特征进行分析,并解释空气质量的成因和影响关系