NN的优势:
具有在各种排放和气象条件下提供污染浓度有效预测的优势,使我们能够轻松调整模型输入以创建用户首选的输出。can be easily applied to any meteorological conditions using transfer learning or fine-tuning with few extra costs.
Motivation
- NOx是O3 和 PM2.5的主要前体,及时估算 NOx 排放量是设计减少 O3 和 PM2.5 污染的有效策略的先决条件。
- 传统基于活动的自下而上的 NOx 排放估算受到统计数据延迟的严重限制(几年后才可用)。
- 高分辨率卫星产品可以支持自上而下近乎实时的NOx限制。
- CTM 可以从多个模拟中得出排放浓度响应平衡方法,但无CTM的方法同样在估算卫星数据排放方面的效率很高。
Settings
- 每个月的前 20 天进行训练,其余天进行测试->确保训练和测试数据集相互独立。
- 使用了大小为 60 x 60 的random crop->为了提高 NN 在处理低级任务时的性能,分别在 5000 和 1000 个 epoch 后估计均方误差损失来训练 VAEdecoder和 VAEencoder,这足以在训练和测试中取得良好的性能。
- Adam3优化器和从 0.001 开始并在训练结束时线性下降到零的动态学习率
- 使用了三个模型性能统计数据:归一化平均偏差 (NMB)、归一化平均误差 (NME) 和 R 平方 (R2)。
Model
Pre-train decoder
输入输出都来自CMAQ(CTM的一种)的模拟,训练后的decoder以不变的参数->辅助encoder的训练。
decoder
输入prior NOx排放(会根据encoder的预测值和真实值来调整)与prior NOx浓度,输出posterior NOx浓度。
encoder
输入来自prior卫星观测的浓度,输出posterior NOx emissions。输出与真实值作偏差纠正后作为prior再次输入decoder,循环此过程就可以完成decoder(已训练好)辅助encoder训练的整个过程。
怎么偏差纠正!!!!!
具体网络结构
六个气象因子被用作decoder和encoder的共同特征
decoder将一天(24 小时)内的六个小时气象因子输入长短期记忆(LSTM),用于聚合时间序列数据中的信息,以模拟历史过程中污染物的积累),U -Net(一种广泛采用的像素到像素模型,可有效利用邻居信息,然后使用 MLP结合其他两个特征(浓度和排放)来预测当前的 NO2。
VAE-encoder 采用与 VAE-decoder 相同的模型结构,但 NOx排放量 取代了当前的 NO2 作为 VAEencoder 的输出,后者成为其特征之一。
Principle of the VAE Emission Predictor
有、、看不懂
variational distribution
变分推理(variational inference,VI)是一种用于近似概率计算的数学工具
基本定义
对于未知且形式难以给出的分布 p(z) ,MCMC采取模拟取样的方法进行近似。但对于大量数据,MCMC的计算较慢。而变分推断的基本思想是,直接构造一个容易观察的分布 q(z) ,不断缩短两个分布的距离,直到收敛。此时, q(z) 就可以看做是 p(z) 的近似。其中, q(z) 也称为变分分布(variational distribution)
假设 x 是观测变量, z 是隐变量, θ 是参数。进行贝叶斯推断中,对隐变量的推断都转化为后验概率计算,所以变分推断中, q(z) 一般不直接近似先验分布 p(z) ,而是近似后验概率 p(z|x)
两分布间的距离一般使用KL散度 KL(q(z)‖p(z|x)) 进行定义,该值越小,两个分布越接近。所以变分推断的目标是 q(z∗)=argminq(z)∈QKL(q(z)‖p(z|x))