小白学习ENSO-GTC

最新推荐文章于 2024-12-30 17:50:47 发布

嗷邬～

最新推荐文章于 2024-12-30 17:50:47 发布

阅读量3.1k

点赞数 6

文章标签：学习

本文链接：https://blog.csdn.net/weixin_45831829/article/details/129522604

版权

ENSO- gtc:具有全局时空遥相关耦合器的ENSO深度学习预测模型,这个是同济大学22年发表的一篇文章。

原文链接：https://agupubs.onlinelibrary.wiley.com/doi/pdf/10.1029/2022MS003132

一、基本概念掌握：

ENSO:EN是厄尔尼诺的缩写，SO是南方涛动的缩写。EN是指东南太平洋的海水温度异常升高现象，SO是指东南太平洋和印度洋到印尼中间区域的大气压反比现象。ENSO是低纬度的海-气相互作用现象，ENSO是导致全球各地破坏性干旱、暴风雨和洪水的罪魁祸首。

EN是海洋温度方面的现象，SO是大气压方面的现象。

ENSO现象持续一段时间（一般认为3个月以上）成为一次ENSO时间，ENSO具有规律性，大概每七年发生一次。

SST：Sea Surface Temperature 就是海面温度。

遥相关：又称大气遥相关，相距数千千米以外两地的气候要素之间达到较高程度的相关性。

Nino3.4指数：Nino3.4指数是Nino3.4区(170°W-120°W，5°S-5°N)的平均海温距平指数，是ENSO现象监测的一个重要指标，Nino3.4指数连续5个月超过0.5℃就定义为一次厄尔尼诺事件。Nino3.4指数是连续的数值。

耦合：是英文 coupling 的翻译。coupling 是指两个（或多个）事物（或人）经常一起出现，相互配合去完成某件事情。二次元文化很喜欢配 CP，这个 CP 就是 coupling。海气耦合模式是指海洋和大气之间相互作用的一种模式。

物理一致性：我理解的物理意义是指实际意义，也就是说实际上要保持一致，文中没有给直接答案，只有这样的解释：先验物理知识纳入模型中可以通过调节模型优化空间来进一步提高模型性能，这被视为物理知情神经网络。

二、摘要：

延续前人提出的热带太平洋多元海气耦合器，设计了全球时空遥相关耦合器(GTC)，对全球海表温度(SST)之间的潜在遥相关进行建模。为此，将太平洋、印度洋和大西洋划分为组成动态图的小海洋斑块，其中相邻关系由先验知识人工构建，非相邻关系由深度学习方法从数据中学习。基于GTC，建立El Niño-Southern Oscillation (ENSO)深度学习预测模型(ENSO-GTC)，设计概率图卷积层学习时空遥相关，即动态图中的非相邻关系。为了保持物理一致性，提出了一种具有图总变分惩罚项的损失函数。我们将ENSO-GTC调整到最优，其Niño3.4指数相关技能在迭代策略下的6个月/12个月/18个月预测中为0.79/0.66/0.51，在直接策略下的20个月预测中高于0.6，优于其他最先进的模型。探讨了ENSO-GTC在有效预报提前时间、持久性障碍改进和预报误差分析方面的预报技巧。此外，我们发现GTC所了解到的与多个ENSO理论完全吻合。开尔文波和罗斯比波的振荡对太平洋海温有6个月的滞后相关性。北太平洋和南太平洋经向模态(NPMM和SPMM)与ENSO的演变密切相关，应加强监测。赤道印度洋/大西洋和太平洋之间的遥相关是非常重要的，通常在ENSO之前有2个月/8个月的滞后相关。

简单总结：

El Niño-Southern涛动(ENSO)是热带太平洋地区最主要的年际气候周期。考虑热带太平洋多元相互作用的耦合ENSO深度学习预报模型取得了显著的效果(简单查了一下，大概是之前用LSTM模型对ENSO进行预测)。尽管ENSO主要发生在热带太平洋，但其他海洋盆地(如印度洋和大西洋)在ENSO的发生、发展和衰减中发挥着重要作用。在本文中，我们构建了一个全球时空遥相关耦合器(GTC)，从全球三大洋海温相互作用的角度捕捉到与ENSO的关键遥相关。通过将全球海洋分割成小海洋斑块，我们构建了一个动力学图来描述海温相互作用。在图中，相邻关系由先验知识人工构建，非相邻关系则通过深度学习方法从数据中学习。基于该耦合器，我们构建了一个ENSO深度学习预测模型(命名为ENSO- gtc)，并设计了概率图卷积层来学习时空遥相关，即动态图中的非相邻关系。我们首先调整ENSO-GTC到最优，并测量其预测技能。然后，我们进行了物理可解释性的什么模型。

(a)耦合器，它考虑了重要ENSO动力机制(如Bjerknes正反馈)指导下太平洋上空的变量间能量相互作用。(b)捕捉三个海洋盆地(印度洋、太平洋和大西洋)在大气桥和海浪上的全球遥相关的耦合器

以我的理解，简单来说由于太平洋上空的ENSO动力机制至关重要（如Bjerknes正反馈和平流反射振荡器），所以作者这群人之前设计了图a这个模型——一个基于图的多元海气耦合器(ASC)。

图1a：

这个耦合器同时在不同物理变量(海温、水汽、风、云和雨)之间执行多元能量响应。在此基础上，我们进一步建立了ENSO DL模型(命名为ENSO- asc)来预测ENSO（这个模型不是本篇论文的重点）。在提前18个月内，其Niño3.4指数的相关技能达到0.5，它是第一个弥合传统的基于动态的建模和最先进的DL技术之间的差距。

图a这个模型只是用来预测赤道太平洋的enso发生情况，虽然ENSO在赤道太平洋发生的频率比较高，但是热带外太平洋变化和其他大洋盆地也一定程度上影响ENSO的强度、持续时间甚至类型。将这些动态特征也纳入ENSO DL预测模型，所以在本文中，作者构建了一个全球时空遥相关耦合器(GTC)，从全球三大洋海温相互作用的角度捕捉ENSO中的关键遥相关，即图1b。

图1b：

在这个耦合器中，太平洋、印度洋和大西洋被划分为小的海洋斑块，我们将这些斑块作为顶点来构建一个动态图。该图中的相邻关系代表了现有的地理/时间邻居，是人工建立的，非相邻关系是通过深度学习从三大洋的地球科学数据中学习到的，这是一个拓扑图。在此基础上，我们进一步实现了ENSO DL预测模型(ENSO-GTC)，模拟了全球海表温度变化和ENSO事件。

Bjerknes正反馈机制：
1、赤道流的存在使得海盆西侧(西太平洋海域)温度高于东侧，造成温跃层结构的东西差异
2、西侧的热源加热驱动大气环流深对流，加强了纬向的沃克环流和经向的Hardly环流，从而加强了副热带东风
3、东风加强了赤道流，继续调整温跃层，加大东西差异，进而加强大气环流，形成正反馈机制西风爆发通过Bjerknes正反馈机制，使得东西温跃层倾斜减弱，东太平洋温跃层加深，SST异常增暖，形成厄尔尼诺。

具体来说，作者构建了一个动力学图来描述海温相互作用，在图中，相邻关系由先验知识人工构建，非相邻关系则通过深度学习方法从数据中学习。

那么首先我们需要建立这个动态图——GTC

三、GTC

在本节中，我们首先全面介绍了GTC动态图的建立，从动机到实现。然后，我们提出了GTC的形式化，通过该动态图来执行和挖掘ENSO中的全局相互作用。

动态图

ENSO的演化受到全球许多重要时空遥相关的调节。以海表温度为例，将全球海表温度作为一个整体，不加区别地用DL模型进行解析，不适合描述详细的区域遥相关。所以我们用图结构建模的方式来构建它。

假设全局海表温度模式为SSTg，我们先将其切成p块大小相同且无重叠的方程式1。这些patch覆盖了不同的海洋区域，是时空动态图和潜在遥相关研究的基本单元。具体来说，p随着patch的大小而变化(patch越小，p越大)。在未来的研究中，GTC将涉及更多的物理变量。

图2 (a)当补丁大小为30*30，并且阈值为0.7时，通过切割全局SST得到的小补丁示例。(d)为输入序列中的所有补丁预先设计的相邻关系Aphy。(b和c)组成了(d)，前者表示相邻空间在同一月份的连接，后者表示同一补丁在不同月份的相邻时间。

由于海洋和陆地在地球上的分布，每个patch中不仅包含海表温度数据，因此，我们定义一个超参数(或阈值)r来过滤土地网格过多的补丁，即我们将丢弃公式1中土地网格占总网格的比例高于r的补丁。如图2a将patch尺寸设置为30◦× 30◦(30相当于1分辨率训练中的30个网格测试数据集），阈值为0.7，大于0.7的patch舍弃，也就是a中灰色部分，其中彩色补丁经过过滤后保留。这样做的原因是，陆地网格在海表温度数据中只包含默认值(如0)，这是学习海表温度品种的噪声。

动态图Adyn的构建就是基于这些patch，Adyn的顶点是patch，两个patch之间的边表示它们之间的动态遥相关。那么问题出现，如何确定这些patch的连接呢，也就是说如何确定这些边？我们认为相邻的patch直接很容易发生作用，即使使遥远的海洋斑块也可以在ENSO期间产生重要的信号，例如滞后相关性。为了充分表示补丁之间的相邻关系和非相邻关系，Adyn被分为两个组件:Aphy和Atopo。前者是由先验物理信息人工确定的，后者是底层的遥相关，需要通过DL模型学习。

相邻关系Aphy的示例如图2d所示。这是前几个月所有补丁的0-1矩阵(例如预测模型的输入序列)。垂直(水平)轴表示不同月份的补丁，黑点(值为1)表示垂直轴上的补丁与水平轴上的另一个补丁在物理上“连接”。

图2a2b c：：

对于这种相邻关系中的连接，有两种直观的物理解释。一种是，在同一月份，每个斑块在空间上都可能受到其地理相邻斑块的影响或扰动。例如,在图2a中，补丁#7与补丁#2/#6/#8/#16相邻。这样的连接可以在图2b所示的相邻关系中形成一个成分。

另一种是对于不同月份，同样编号的补丁也进行连接

2c是不同月份，同一编号的patch在同一空间上的连接，这时候不考虑时间，在这种情况下我们忽略了时间轴的影响，未来月份的补丁也可以连接到前几个月的补丁。因为我们认为之前的序列已经是现有的证据，所以没有必要沿着时间轴进行推断。另一方面，每个斑块的全时间连接增强了局部特征的提取。所以，图2d所示的整个相邻关系可以由这两个成分来确定。我们使用Aphy来表示它。

以我的理解来说，先看d，d的横纵坐标代表月份。x轴的patch在和y轴的patch进行了连接，同一月份下，就是斜对角线这一部分。它是同一时间，同一patch在不同空间上的影响，这种patch之间的相邻关系可以表示成图 b。不同月份也就是除对角线之外的部分，是同一空间，同一patch在不同时间上的影响，可以表示为图c。图2d所示的整个相邻关系可以由这两个成分来确定。我们使用Aphy来表示它。

四、ENSO-GTC

在本节中，我们全面介绍了基于GTC的ENSO DL预测模型，即ENSO-GTC。我们首先建立模型的整个结构，然后描述它的组件。

4.1ENSO-GTC的架构

ENSO-GTC(见图3)由四个模块组成:补丁编码器、全局时空记忆提取器、GTC和补丁解码器。

补丁编码器单独解析每个小海洋补丁，这是所有补丁的共享模块，并捕获潜在的局部特征。全局时空记忆提取器提取所有补丁中的全局时空信息。GTC学习非相邻关系，并在动态图的引导下模拟相互作用。补丁解码器将GTC的补丁特征端到端分别还原到对应的小补丁中，也是所有补丁的共享模块。

图3中的黑色箭头显示ENSO-GTC中的数据流。首先将整个海洋数据切割成小patch，并将得到的小patch传播到patch编码器和全局时空记忆提取器中。然后，GTC在我们提出的概率图卷积层的帮助下将局部和全局特征耦合起来，该层学习隐藏在数据中的潜在遥相关。最后，将从补丁解码器中恢复的补丁重新排列到海洋数据中。

图3 我们提议的ENSO-GTC架构。输入序列被切割成小的patch，输出也是预测结果的patch序列。ENSO-GTC由四个部分组成，包括补丁编码器、全局时空记忆提取器、GTC和补丁解码器。黑色箭头表示该模型中的数据流。

4.2. 小斑块局部时空特征提取的斑块编码器

小斑块代表每个月的区域海气状况，我们使用共享的斑块编码器提取它们各自的局部时空信息，以保持物理一致性。

ENSO的多尺度演化特征明显，且小尺度变化趋同变大并促进ENSO的发展（也就是说有些大尺度的影响着ENSO，有些虽然影响比较小，但也在逐步更大的影响着）。考虑到这一点，我们设计了一个逐渐缩小的网络结构作为补丁编码器，（如图四），它可以通过卷积层和池化层的叠加来调节多个尺度。

图4 (c)补丁编码器的结构，由堆叠的编码器块组成。Encoder块包括n个密集层(浅灰色框)和1个池化层(深灰色框)。(a、b)致密层和池化层的详细结构。三个超参数(a和b),也就是膨胀系数增长率和theta，控制密集层中的通道变化和池化层中的通道收缩。

整个编码器由编码器模块组成，编码器模块是图4a中的多个密集层和图4b中的池化层的组合。密集层由两个批处理归一化层和一个卷积层组成。卷积层不改变特征映射形状，而是改变通道大小，通道大小具有扩展-收缩行为，如蓝色框所示的膨胀系数和增长率两超参数控制这种行为。假设的输入通道大小致密层c,输出通道的大小将c+,增长率连接的是输入和输出的最后卷积层,这意味着通过增长率通道大小增加了。这也可以称为密集连接，它可以将底层特征直接传播到高层，并尽可能保留原始特征。池化层由三层组成，如图4b所示。卷积层位于池化层的中间，池化层是通过一个超参数theta(<1)来缩小通道大小。池化层通过max-pooling缩小特征图的形状，有助于去除冗余信息，扩展接受域，提高多尺度特征提取的效率。假设池化层的输入通道大小为c，输出通道大小为c*theta，特征图形状也会被池化内核改变。

我的理解：这个patch编码器是由patch编码器模块组成的。每个模块里有多个密集层和池化层，其中，密集层由两个批处理归一化层和一个卷积层组成，主要负责通过膨胀系数和增长率来控制通道大小，池化层由批处理层，卷积层和max-pooling组成。主要通过控制theta缩小通道，max-pooling缩小特征图的形状（可以理解为下采样）。进而来调节多个尺度，那么为什么要调节尺度呢，是因为有些大尺度的影响着ENSO，有些虽然影响比较小，但也在逐步更大的影响着。考虑到这一点，我们设计了一个逐渐缩小的网络结构作为补丁编码器。

小块按顺序传播到共享编码器中，保证了局部空间特征提取的一致性。更重要的是，维护补丁顺序是后续GTC中相邻关系和非相邻关系的关键要求。

4.3全局时空记忆提取器

海表温度变化除了局地特征外，还具有全球时空特征，反映了ENSO振幅的趋势和周期性。因此，我们设计了一个与编码器并行的全局时空记忆提取器，如图5所示：

图5 全局时空记忆提取器的结构。它是一个双头模块。空间轨道利用二维卷积，时间轨道利用一维卷积。输出是来自两个轨道的结果的连接。内核和通道大小标记在每一层下面。

该提取器是一个双头结构，分别提取空间和时间记忆。在空间轨道上，利用二维卷积层沿m×p提取全局空间依赖项，注意了全局海表温度的普遍性。在时间轨道上，一维卷积层也沿着m×p捕获时间记忆，保持顺序。卷积核大小和信道变化均标记在图5中。在获得全局时空特征后，我们将其压平到1维，并将它们级联在一起作为全局时空记忆Mglobal。（m代表输入月的长度,p代表每个月补丁数量,w和h是补丁的大小）

3.4具有概率图卷积层的GTC

如第2节所述，GTC采用动态图的方式进行特征聚合，动态图由相邻关系和非相邻关系组成。前者是精心设计的，后者是由我们提出的概率图卷积层学习的。

3.4.1. 具有相邻关系的特征聚合

我们使用改进的邻接聚合函数来模拟邻居之间的交互，如式7所示：

表示根据Aphy聚合的特征。是补丁编码器对补丁i提取的局部特征，是对应的邻居补丁。deg(i)表示补丁“i”的度(邻居数），用于归一化不平衡邻居数的影响。图6a显示了该过程的一个示例，它为中心节点(红圈)聚合邻居特征(蓝圈)。由式7可知，物理相互作用可由aggr(.)函数学习，该函数模拟了相邻斑块之间传播到中心的不稳定能量。

如图6a中，先对f和其他节点的特征进行提取，并对其特征进行连接，然后通过aggr(.)函数计算他们的相互作用，最后进行归一化不平衡邻居数的影响，即可得到f节点聚合的特征。

4.4.2非相邻关系学习与对应特征聚合

非相邻关系(拓扑图)不能预先定义。我们提出了概率图卷积层，首先学习这种连接，然后执行补丁特征之间的交互。同时，考虑到全球海表温度品种具有复杂的混沌性和极端的不确定性，该层采用单个概率分布来表示非相邻连接，量化不同的不确定性，类似于集合预测。

在概率图卷积层中，最关键的问题是如何确认高度不可知的非相邻连接。我们采用滤波的解决方案，即首先假设所有的patch都是相互连接的(全连接)，然后经过相似度计算和排序，选择排名靠前的K连接作为拓扑连接。滤波解决方案的动机是，具有相似特征的斑块在进化阶段更一致，这是由潜在的时空遥相关调制的。

基于此求解，概率图卷积层的整个过程可以总结如下(见图6b)。首先，计算全连接假设下的补丁对之间的相似度。其次，根据滤波解下的相似度生成拓扑连接;第三，通过学习到的非相邻连接聚合每个补丁的特征。我们设计了一个拓扑图生成器来实现该层的前两步，并设计了一个概率聚合计算来实现第三步。拓扑图生成器的详细计算单元如图6c所示。

我的理解是：先将特征图丢进去，然后我们设计了一个拓扑图生成器，让他来计算全连接假设下patch之间的相似度（我们先假设是全连接），经过相似度计算，我们将排名靠前的K个连接生成拓扑连接。其次，设计了一个概率聚合计算，通过学习到的非相邻关系来聚合这些patch的特征。

图6 (a)相邻关系特征聚合的一个例子，下式为红色中心节点与相邻节点的聚合方式。(b)提出的概率图卷积层，其输入是来自补丁编码器的补丁特征和来自提取器的全局记忆。拓扑图生成器以概率分布的形式生成非相邻关系，然后根据采样图采用蒙特卡罗方法进行特征聚合。(c)拓扑图生成器的详细描述，其中包含不同的门模块和用于过滤连接的顶部K层。

4.5. 补丁解码器预测结果端到端

从GTC获得输出特征后，我们首先对不同月份的同数量补丁进行月平均运算，整合预测月份的补丁特征，然后将平均的补丁特征按顺序传播到补丁解码器中，并保持顺序。

patch解码器和patch编码器结构对称，逐步放大和恢复多尺度时空模式。与编码器结构不同在于这两个层都使用了transform-convolution (Noh et al, 2015)层而不是原始的卷积层来模拟编码器中特征提取的反向过程。两个独立的变换卷积层被用来校正最后的上采样结果。

五、实验与结果分析

我们从以下三个方面进行了广泛的实验。首先，我们通过仔细确定三个超参数，包括海洋斑块中陆地比例的阈值R，顶点K拓扑连接和输入序列长度，将ENSO-GTC调优到最优。然后我们将最优模型与其他最先进的DL模型进行比较。其次，在验证期利用ENSO- gtc进行ENSO预报，考察其有效预报提前时间、持久性障碍改进和预报误差分析等预报技巧。第三，我们分析了ENSO- gtc的物理可解释性，通过可视化学习的非相邻关系来解释ENSO中的自然规律和物理机制，如海洋记忆的空间遥相关和滞后相关性。

5.1最优超参数的确定

阈值r决定了斑块中陆地栅格的比例，这可能会干扰模型在海表温度演化过程中提取特征。顶部k拓扑连接决定了潜在遥连接的规模，根据实际动力机制，遥连接应满足物理约束。

此外，输入序列长度对于深度学习模型提取历史趋势和周期性也很重要。因此，在本节中，我们将通过调整这三个参数来研究联合效应，然后确定最佳设置。结果如图8所示。请注意，K也被转换为非相邻关系(拓扑图)中新连接与总连接的比率，而对应的是这些实验中的模型都对下一个月进行预测。这些线代表了下个月预测的Niño3.4相关技能，在很大程度上可以反映模型在一定超参数设置下的表现。x轴表示不同的K值，线的颜色表示不同的阈值r。四个子数字应用不同的输入序列长度。

图8。模型的性能随着不同的超参数设置而变化，包括输入序列长度、patch中土地比例的阈值r和顶点k拓扑连接。

通过对比上面四幅图可以得出以下结论：

1.随着相关技能的提高，增加输入序列长度对模型性能有很大的正向影响。但当输入序列长度大于6个月时，这种改善不明显。我们认为6个月的输入是对我们模型最有利的；

2.由图可以看出，绿色线高于黄色线高于蓝色线。出现这一现象一共有两个原因：1）输入patch越大，所包含的土地越多;但是HadiSST数据集中不涉及土地网格的值，所以覆盖面积较大的斑块严重限制了模型对enso相关海温底层机制的学习能力。2）当阈值r过小的时候，会导致靠近大陆的沿海地区被大量抛弃，这导致一些与enso相关的关键沿海动力机制被严重忽视。

3.对于参数K，我们可以看到所有子图中的每条曲线在K= 0.15处都有一个明显的转折点，如果K设置的太小，拓扑图的复杂性就太小，无法描述复杂的潜在关系。反，如果将K设置为较大，则拓扑图中的许多连接是强制制造关系，这与ENSO动态机制不一致。

设置r= 0.7，K= 0.15，这是最优的模型结构。

5.2与其他先进模型的性能比较

在优化模型的基础上，我们将ENSO-GTC与其他一些先进的时空序列预测DL模型进行了比较，除最基本的模型(1)外，模型(2-4)都更关注全球海表温度演化过程中的瞬时变化。5）是之前提到的ASC模型，它关注的是局部。模型(1-6)采用迭代策略，模型(7)使用直接策略。我们在相同的海表温度数据集上训练和评估它们，除了模型(5)，它仍然使用原始设计的多元数据集，然后对前18个月进行预测。

标记为迭代策略：预测策略是一个非常重要的问题。一般来说，大多数ENSO预测模型对下一个连续月进行预测，长期结果需要多次迭代。

标记为直接策略：而有一种更直接的方法可以用时间间隔来预测未来的状态，比如用1 - 6月的海温来预测12月的海温状态。直接策略需要每个超前月的单独模型。

从直观上看，模型(7)在表中明显优于其他模型，特别是在18个月的预测中，这表明直接策略是更好的选择。重要的原因在于，直接策略需要每个超前月的单独模型，不像迭代策略那样受累积预测误差的影响。

对比模型(6和5)，我们发现15个领先月有较大的增强，ENSO-GTC从12个领先月到15个领先月的技能下降也较小。这表明ENSOGTC在长期预测中比ENSO-ASC具有更高的预测技能持续性。我们认为动态图在这种情况下起着至关重要的作用。

5.3ENSO-GTC的预测技巧

4.3.1. 有效预测领先月

长期ENSO预报一直是气象研究中的一个难题。在确定最优模型结构后，在验证期分别采用迭代和直接策略将预测提前时间逐步延长至20个月，考察ENSOGTC的长期预测技能，然后计算三个Niño指数的月度相关技能。结果如图9所示。

图9 三个Niño指数的月度相关性技能。实线代表直接策略虚线代表迭代策略。

总结：

无论哪种策略，Niño相关技能都会随着领先月份的增加而减少。但在18个领先月内仍能保持0.5以上(迭代策略中的Niño4相关技能除外)。直接策略（实线）下降速度较慢且成线性；迭代策略(虚线)中，相关技能呈非线性下降，呈现出减少-持续-减少的趋势，并且在减少阶段的下降幅度比直接策略更大。在短期领先月(8个领先月以内)，由于迭代过程中累积的预测误差，预测技能从较高水平(0.9以上)下降到中等水平(0.7左右)，这也是ENSO可预测性下降的原因。对于技能持续阶段(8-14个领先月)表现出平稳的相关技能，我们认为主要是由于ENSO-GTC具有较高的泛化性，可以容忍较大的累积预测误差。随后，在长期先行月(超过14个月)，累积误差过大，超过泛化，ENSO可预测性较低，这都导致了第二次快速下降。

详细比较迭代策略和直接策略的相关技能，发现迭代策略中位置越东的Niño指数(即Niño 3> Niño 3.4 > Niño 4)， ENSOGTC的预测技能越好，而直接策略中位置依赖性不明显。这是因为，Niño 4区域海表温度受NPMM影响尤其明显，在偏东的区域(即Niño 3区域)，海表温度主要由温跃层反馈过程调制，其中包含相对较小的不确定性和预测误差。因此，在迭代过程中，Niño 4和Niño 3.4区域的预测误差更容易累积并不断放大。直接策略的预测技巧不受累积误差的影响，累积误差只与不同Niño区域的预测不确定性有关。

综上所述，采用迭代策略的ENSO-GTC可以在18个领先月内提供有效的预测(Niño相关技能大于0.5)，而采用直接策略的ENSO-GTC在20个领先月内具有更高的预测技能，相关性大于0.6。但直接策略需要针对不同的领先月份制定单独的模型。因此，这启发我们，当计算资源充足时，直接策略可能更适合长期操作的ENSO预测。

5.3.2. 持久性障碍的改进

持续性障碍(PBs)广泛存在于许多数值和统计的ENSO预测模型中，通常出现在北方春季(3 - 4 - 5月)和夏季(6 - 7 - 8月)。从图9中直接策略和迭代策略的技能减少率预测分别为线性趋势和减少-持续-减少趋势，我们推断具有直接策略的ENSO-GTC不会遇到PBs，具有迭代策略的ENSO-GTC可以大大降低PBs的影响。因此在本节中，我们做了详细的实验来验证这一猜想。

对于直接策略，我们在验证期以12- 18个月的提前期进行ENSO预测，并显示Niño3.4的变化以及观测结果(即Niño3.4指数从观测数据)，如图10所示。黑线是地面真相，两条彩色线是ENSO-GTC的结果。图例中的数字是对应的相关技能。

图10 采用12-(蓝色)/18-(黄色)月直接策略的ENSO-GTC模型在验证期(2011.12-2021.3)的预测结果。黑线是基本真理。图例中的数字是对应的相关技能。

这两个预测都与观测值非常相似，特别是2015/2016年超级厄尔尼诺Niño。同时，振幅和相位与观测值基本一致。然后，我们以每月MSE的形式分别计算了这两个预报在3月至8月(春夏)的月度预报误差。12个月和18个月的预测结果分别为0.16和0.20，几乎等于总平均误差。2018/2019年的结果，与平均误差相当甚至更好。我们认为直接策略的预测结果不经过春季或夏季的迭代，从而避免了累积误差的产生。

对于迭代策略，我们按照Hou et al. (2019)， Hu et al.(2019)的建议，使用不同的预测起始日历月进行长期预测，并分别计算每个先行月Niño3和Niño4指数的月度相关技能。结果如图11所示。在该图中，横轴表示不同的领先月份，纵轴表示不同的预测开始日历月。

图11 在不同日历月开始预报时，采用迭代策略对ENSO-GTC验证期内Niño3 (a)和Niño4 (b)指数的月相关性技能进行分析。单元格的颜色越深，表示模型的技能越高，阴影线的单元格表示技能在0.5以上。单元格上的白色数字代表日历月份的预测。

总的来说，对于这两个指数，OND(10月、11月和12月)的预测通常具有较低的技能，颜色较浅，阴影线细胞较少，而MJJ(5月、6月和7月)的预测具有较高的技能，颜色较深，阴影细胞较多。OND的预测即将迎来春夏两季，这大大增加了预测误差，干扰了后续迭代，预测技能迅速下降。这说明迭代策略在一定程度上受到PBs的影响。

5.3.3. 预测误差分析

通过对超前月和PB的分析，我们知道在迭代策略中预测误差的传递是不可避免的。在本节中，我们使用最优模型在验证期内使用迭代策略进行18个月的预测，然后计算每个领先月的预测与观测之间的网格相关性，形成预测误差热图，如图12所示。请注意，我们仍然使用相关性来衡量预测误差。颜色较深的区域代表较大的预测误差。

图12 采用迭代策略的ENSO-GTC验证期内的月预报误差。较暗的区域代表较大的预测误差。(a-c)反映了预测误差的带状扩展，标记为阶段1。(d-f)向全球呈现严重的经向误差传播，标记为阶段2。黄色箭头表示预测误差传播方向。

我们发现短期(3-9个月)和长期(12-18个月)预测误差的演变幅度和模式明显不同。所以我们把整个过程分为两个阶段。即阶段1从(a)到(c)，反映了预测误差的带状扩展。阶段2从(d)到(f)，显示出严重的经向误差向全球扩散。

六、结论

我们延续之前提出的热带太平洋多元海气耦合(ASC)，考虑全球三大洋的相互作用，构建了一个海气耦合。这个耦合器将太平洋、印度洋和大西洋切割成小的海洋斑块，并构建了一个动力学图来研究遥相关。在动态图中，根据明确的地理/时间邻居信息人工设计相邻关系，并通过深度学习方法从数据中学习非相邻关系。基于GTC，提出了一种包含4个子模块的ENSO-GTC预测模型。概率图卷积层的设计是为了学习动态图中的非相邻关系小海洋斑块之间潜在的遥相关。我们设计了一个具有图总变分惩罚项的损失函数，以保持非相邻关系中的物理一致性。

一些重要的结论可以总结如下: 1.:通过比较，ENSO-GTC比我们之前的模型(ENSO-ASC)和其他DL模型(ConvLSTM, PredRNN, PhyDNet, MIM)具有更高的性能。

2.采用直接策略的ENSO-GTC在长期预测中几乎不受持久性障碍的影响，而采用迭代策略的ENSO-GTC在很大程度上削弱持久性障碍。

3.从亮带和高亮斑块的分布中，我们发现GTC所了解的与多个ENSO理论完全吻合。学习到的拓扑图在热带太平洋表现出明显的6个月滞后相关性(在带1和带5678之间)，这表明了延迟振子理论。

未来，我们将在深度上考虑全球海洋的多元耦合和遥相关，构建更精细的ENSO DL耦合器。同时，我们还将因果关系发现纳入DL耦合器中，挖掘ENSO的物理机制，如最优前导信号、最优生长误差、目标观测敏感区域等。