20221018Rapid Inference of Nitrogen Oxide Emissions Based on a Top-Down Method with a Physically...

本文链接：https://blog.csdn.net/WRStop/article/details/127382582

NN的优势：

具有在各种排放和气象条件下提供污染浓度有效预测的优势，使我们能够轻松调整模型输入以创建用户首选的输出。can be easily applied to any meteorological conditions using transfer learning or fine-tuning with few extra costs.

Motivation

NOx是O3 和 PM2.5的主要前体，及时估算 NOx 排放量是设计减少 O3 和 PM2.5 污染的有效策略的先决条件。
传统基于活动的自下而上的 NOx 排放估算受到统计数据延迟的严重限制(几年后才可用)。
高分辨率卫星产品可以支持自上而下近乎实时的NOx限制。
CTM 可以从多个模拟中得出排放浓度响应平衡方法，但无CTM的方法同样在估算卫星数据排放方面的效率很高。

Settings

每个月的前 20 天进行训练，其余天进行测试->确保训练和测试数据集相互独立。
使用了大小为 60 x 60 的random crop->为了提高 NN 在处理低级任务时的性能，分别在 5000 和 1000 个 epoch 后估计均方误差损失来训练 VAEdecoder和 VAEencoder，这足以在训练和测试中取得良好的性能。
Adam3优化器和从 0.001 开始并在训练结束时线性下降到零的动态学习率
使用了三个模型性能统计数据:归一化平均偏差 (NMB)、归一化平均误差 (NME) 和 R 平方 (R2)。

Model

Pre-train decoder

输入输出都来自CMAQ(CTM的一种)的模拟，训练后的decoder以不变的参数->辅助encoder的训练。

decoder

输入prior NOx排放（会根据encoder的预测值和真实值来调整）与prior NOx浓度，输出posterior NOx浓度。

encoder

输入来自prior卫星观测的浓度，输出posterior NOx emissions。输出与真实值作偏差纠正后作为prior再次输入decoder，循环此过程就可以完成decoder(已训练好)辅助encoder训练的整个过程。

怎么偏差纠正！！！！！

具体网络结构

六个气象因子被用作decoder和encoder的共同特征

decoder将一天（24 小时）内的六个小时气象因子输入长短期记忆（LSTM），用于聚合时间序列数据中的信息，以模拟历史过程中污染物的积累），U -Net（一种广泛采用的像素到像素模型，可有效利用邻居信息，然后使用 MLP结合其他两个特征（浓度和排放）来预测当前的 NO2。

VAE-encoder 采用与 VAE-decoder 相同的模型结构，但 NOx排放量取代了当前的 NO2 作为 VAEencoder 的输出，后者成为其特征之一。

Principle of the VAE Emission Predictor

有、、看不懂

variational distribution

数学工具-变分推断 - 知乎

变分推理（variational inference，VI）是一种用于近似概率计算的数学工具

基本定义

对于未知且形式难以给出的分布 p(z) ，MCMC采取模拟取样的方法进行近似。但对于大量数据，MCMC的计算较慢。而变分推断的基本思想是，直接构造一个容易观察的分布 q(z) ，不断缩短两个分布的距离，直到收敛。此时， q(z) 就可以看做是 p(z) 的近似。其中， q(z) 也称为变分分布（variational distribution）

假设 x 是观测变量， z 是隐变量， θ 是参数。进行贝叶斯推断中，对隐变量的推断都转化为后验概率计算，所以变分推断中， q(z) 一般不直接近似先验分布 p(z) ，而是近似后验概率 p(z|x)

两分布间的距离一般使用KL散度 KL(q(z)‖p(z|x)) 进行定义，该值越小，两个分布越接近。所以变分推断的目标是 q(z∗)=arg⁡minq(z)∈QKL(q(z)‖p(z|x))