《Deep Air: Forecasting Air Pollution in Beijing, China》笔记

最新推荐文章于 2024-01-28 22:33:48 发布

l_BAT

最新推荐文章于 2024-01-28 22:33:48 发布

阅读量549

点赞数

分类专栏：读书笔记文章标签：深度学习人工智能神经网络

本文链接：https://blog.csdn.net/is80x86/article/details/125393920

版权

读书笔记专栏收录该内容

6 篇文章 1 订阅

订阅专栏

Vikram Reddy, Pavan Yedavalli, Shrestha Mohanty, Udit Nakhat

项目网站

Deep Air | UC Berkeley School of Informationhttps://www.ischool.berkeley.edu/projects/2017/deep-air

代码

http://github.com/vikmreddy/deep-airhttp://github.com/vikmreddy/deep-air

5.1.2 LSTM序列到标量（Sequence to Scalar）

6.1.1 调试（tuning）支持向量回归SVR（Support Vector Regressor）序列到标量和LSTM序列到标量（sequence to scalar）

6.1.2 调试LSTM序列到序列模型（Sequence to Sequence）

1. 摘要

使用LSTM循环神经网络预测北京未来空气质量。

2. 引言

环境科学中的确定性模型寻求从分子层面了解空气污染物行为，模拟传播扩散模式。计算机科学和统计学的线性回归有局限。支持向量回归主要预测当前时间的污染而不是将来的污染。

3. 理论背景

简单RNN和LSTM RNN对比如下两图。

4. 数据

4.1 数据描述

2010到2014UCI、2015-2017中科院、2015-2017美国NOAA。

4.2 预处理和特征

经过单位统一、清洗等，经过预处理的数据集总结如下图，目标变量是pm2.5，维度是8×68870。

4.3 数据分割

数据分为四个数据集：训练、开发，和两个不关联的测试集。

5. 方法

5.1 持续模型基准

两个持续模型作为基准。一个持续模型利用之前一个或多个时间步预测下个时间步的目标变量。这一基准背后隐藏的概念驱动（以及假设）是所预测时间步与它之前的数据区别不大。换言之，数据在短期内持续不变。为预测下一小时或几小时的污染，考虑将气象学和污染特征设定为一个特定的时间延迟值（time lag value）。例如，如果想要理解过去10个小时的气象和污染数据如何影响下个小时的污染水平，将时间延迟值取10，预测小时取1.模型取了多个时间延迟值和预测小时数，使用均方根误差（RMSE）衡量它们的表现。

5.1.1 非线性回归

径向基函数作为核心的支持向量回归（Support Vector Regressor with a radial basis function kernel）。因数据有某种循环模式，故该非线性方法可能捕捉到其中的一些关系。

5.1.2 LSTM序列到标量（Sequence to Scalar）

采用了不同时间步长，包括1、3、4、6、8、10、15、25步；还进行了不同网络配置实验，包括改变层数、层类型、每层节点数、损失函数、批大小（batch size）和迭代次数。

5.2 预测模型

预测未来数小时或数天空气污染的模型。

5.2.1 LSTM序列到序列

使用LSTM编码器解码器（LSTM Encoder and Decoder）结构。未来的时间步数为定值。同样使用了不同网络配置，包括层数、每层节点数和批大小。

根据Geman等的研究，改变隐藏节点数可能减少过拟合和增加模型生成。可能的首要原则是将隐藏的宽度设置为输入输出维度之和的三分之二[Stuart Geman, Elie Bienenstock, and Ren´e Doursat. “Neural Networks and the Bias/Variance Dilemma”. In: Neural Comput. 4.1 (Jan. 1992), pp. 1–58. ISSN: 0899-667.DOI:10.1162/neco.1992.4.1.1.URL: http://dx.doi.org/10.1162/neco.1992.4.1.1.]。

输入的维度为30，输出12，故隐藏层数为(2/3)*42=14.即用过去30小时的数据预测将来的12个小时。实验结果告诉我们隐藏层维度大小应小于输入维度而大于输出维度。

下图展示了文章深度LSTM架构。