Detecting Causality in Complex Ecosystems(检测复杂生态系统中的因果关系)


作者:George Sugihara, Robert May, Hao Ye,1Chih-hao Hsieh, Ethan Deyle, Michael Fogarty, Stephan Munch
翻译:Wendy

摘要

  识别因果网络对于在气候、流行病学、金融监管等方面提出有效的政策和管理建议非常重要。提出了一种基于非线性状态空间重构的方法,能够区分因果关系和相关关系。它扩展到不可分离的弱连接动态系统(目前的格兰杰因果关系范式没有覆盖的情况)。该方法通过简单的模型(与现实世界相反,我们知道潜在的方程/关系,因此可以检查我们的方法的有效性)和应用于真实的生态系统,包括有争议的沙丁鱼-凤尾鱼-温度问题来说明。

Ⅰ 引言

  在复杂的系统中确定因果关系是很困难的。矛盾出现在许多科学环境中,变量有时是积极耦合的,但有时是不相关的,甚至是依赖于系统状态的消极耦合(视频S1)。波罗的海渔业,例如,表现出完全不同的动态控制机制(从底部自顶向下 )根据阈值大量浮游生物,导致鱼类和浮游动物之间的相关性变化迹象。这种相互依存的行为定义的标志是一个复杂的非线性系统,并非线性在自然界中无处不在。

  短暂的或“海市蜃楼”相关性在即使是最简单的非线性系统也是常见的,如图Fig.1所示,表现出混沌行为的两组微分方程:
在这里插入图片描述
当这种情况发生时,长期处于积极耦合状态的变量可能会自发地变得反相关或解耦;这在将模型与观测数据拟合时可能会产生问题。
在这里插入图片描述
  虽然相关性既不是建立因果关系的必要条件,也不是充分条件,但它在我们的启发式思维中仍然根深蒂固。例如,人们可以得出结论,图1中的变量没有因果关系,因为它们不相关。显然,缺乏相关性并不意味着缺乏因果关系。由于这个原因,以及刚刚给出的原因,使用相关性来推断因果关系是有风险的,特别是当我们逐渐认识到非线性动力学无处不在时。

  另一种方法,格兰杰因果关系(GC),提供了一个框架,使用可预测性而不是相关性来识别时间序列变量之间的因果关系。自Berkeley以来,GC被认为是因果问题的主要进展。

  变量X被认为是Y“格兰杰原因”条件是,假如将变量X从所有可能的因果变量集合中删除,Y的可预测性(在某些理想化的模型中)下降。GC的关键要求是可分离性,即有关导致因素的信息是该变量独有的(例如,捕食者影响的信息不包含在猎物的时间序列中),可以通过从模型中消除该变量来验证。可分性是纯随机和线性系统的特征,GC可以用于检测非线性系统中强耦合(同步)变量之间的相互作用。可分离性反映了这样一种观点:系统可以一次理解一部分,而不是作为一个整体来理解。

  然而,正如Granger 早期所认识到的,这种方法在确定性的环境下可能会有问题,特别是在具有弱耦合或中度耦合的动态系统中。例如,GC在图1中给出了不明确的系统结果(GC计算见S1)。这是因为这类系统不能满足可分离性,它不同于经济学的传统和单一鱼种的渔业管理,需要作为一个整体加以考虑。也就是说,在确定性动态系统(即使是有噪声的系统)中,如果X是Y的原因,关于X的信息将冗余地存在于Y本身,并且不能从Takens定理 的U-a结果中正式删除。为了直观地看到这一点,我们简单地注意到Eq. 1可以被重写为Y(t + 1) 按照Y(t)和Y(t - 1)的模型(见S1方框中的工作示例)。因此,与预测yt有关的X(t)信息在这个系统中是冗余的,不能简单地通过消除显式变量X来删除。当格兰杰的定义被违反时,GC计算就不再有效,这就留下了在这样的系统中检测因果关系的问题。

  除了不可分离性之外,生态系统与使用格兰杰方法研究的典型系统在其他重要方面有所不同。首先,在生态系统动力学中,弱-中度耦合是常态。McCann 和其他人提出了一个强有力的案例,证明了弱耦合在生态食物网中的普遍存在,并证明了它们对系统稳定性的重要性。其次,生态系统通常会受到外部驱动变量(如温度、降水和上升流)的影响。因为许多物种共享相似的非生物环境,这可能导致非相互作用的物种之间的相关性和明显的同步。使得从虚假的相关性中筛选出真实的相互作用的任务变得更加复杂。因此,在生态学中,有以下方法非常重要:(i)处理不可分离系统,(ii)识别弱耦合变量,以及(iii)区分物种之间的相互作用和共享驱动变量的影响。

  在这里,我们研究了一种方法,专门针对在生态时间序列中识别因果关系。我们用简单的模型例子演示了我们方法的原理,表明该方法将物种相互作用与共享驱动变量的影响区分开来。最后,我们将方法应用于生态实验数据和现场研究,显示它如何区分自上而下与自下而上的控制经典草履虫实验和澄清的持续争论的本质之间的交互沙丁鱼,凤尾鱼,海洋表面温度在加利福尼亚海流的生态系统。

  我们的方法不能与许多使用GC的有效方法竞争(见补充文本);相反,它专门针对GC不涉及的一类系统。在GC计算S1到S5和box S1中验证,GC并不适用于这类系统。

动态因果关系和CCM

  如果世界是纯粹随机的,GC就适用。然而,在确定性和动力学并非完全随机的程度上,将有一个潜在的流形控制动力学(代表连贯的轨迹,而不是随机的纠缠)。

  在动力系统理论中,如果时间序列变量(比如X和Y)来自同一个动力系统 ,那么它们就有因果联系——也就是说,它们共享一个共同的吸引器流形(视频S1到S3说明了这个想法)。这意味着每个变量都可以识别对方的状态(例如,过去的猎物种群信息可以从捕食者的时间序列中恢复,反之亦然)。此外,当一个变量X是人口变量Y的随机环境驱动因素时,关于X状态的信息可以从Y中恢复,但反之亦然。鱼的时间序列可以用来估计天气,但不能反过来。这与格兰杰的直觉方案相悖(见方框S1中的解释)。

  我们的替代方法,收敛交叉映射(CCM),通过测量Y值的历史记录可以可靠地估计X的状态的程度来测试因果关系。 仅当X因果影响Y时,才会发生这种情况。 更详细地讲,CCM通过查看由Y,MY构造的吸引器歧管中的点与X歧管MX中的点之间是否存在对应关系,来寻找Y在时间序列中X的信号。 两个歧管分别由时间序列变量Y和X的滞后坐标构造得到(附件S1和S2)。

  本质上,这个想法是看 Y流形上附近点的时间指数是否可以用来识别mx上的附近点。如果是这样,那么可以用Y来估计X,反之亦然。这个过程在图2和影片S3中进行了说明,包括(26)中的算法在内的全部技术细节。
在这里插入图片描述
  请注意,CCM与交叉预测的一般概念相关,但有重要区别。首先,CCM估计跨变量的“状态”,而不预测系统如何在流形上“进化” 。这消除了可能的信息损失从混沌动力学(李雅普诺夫发散)和容纳非动态(即随机)变量。更重要的是,CCM涉及到收敛性,这是区分因果关系和简单相关关系的一个关键属性。收敛意味着交叉映射估计在时间序列长度为L(用于构建库的样本大小)时提高了估计技能(图3A、图S2和框S1)。随着数据的增加,定义吸引子的轨迹会填充进来,导致最接近的邻居和随着L增加的估计误差下降(一个更高的相关系数)(图2)。因此,CCM成为因果关系的必要条件。确实,未能考虑到收敛性,这就解释了文献中报道的结果与相关方法相矛盾(补充文本和图S5)。

  在实际应用中,阴影流形是真实系统的低维近似值,收敛将受到观测误差,过程噪声和时间序列长度L的限制。因此,在场数据有限或嘈杂的情况下,证明了CCM在带L限制下的可预测性提高这一点 图S3)。 有关数据需求的讨论,请参见(26)。
在这里插入图片描述

识别因果关系的框架

(i)通过功能耦合进行双向因果关系识别

  双向因果关系类似于Granger(18)所描述的两个时间序列之间的“反馈”概念,也是Takens(19)所涵盖的主要情况。简单地说,如果变量是相互耦合的(例如,捕食者和猎物),它们将在两个方向上交叉映射(图3A和图S1A)。因此,每个变量都可以从其他变量来估计(捕食者的历史可以估计猎物的状态)。图3B给出了该情况的例子。

  请注意,随着耦合强度的增加,受影响变量中的信息变得更加明显。因此,它们的流形将包含更强烈的历史特征的原因。在图1 (Eq. 1)中,例如,by,x>> bx, y物种x对Y的影响更强,意味着预测x的收敛速度比预测Y的更快(图3A)。因此,在所有条件相同的情况下,交叉映射的相对技巧可以表示因果效应的相对强度(图3B)。

(ii)单向因果关系

  其中,物种X影响着y的动态变化,而物种y对X无影响(图2)。3C和图S1B)。这描述了一种两性或共生关系,或表示外部环境的强迫。

   图3C在β(x,y)=0时检查系统。注意适度的强烈迫使X(通过β(x,y)),尽管Y不起任何作用,Y的同时依赖关系可能会导致X的局部交叉映射。但是,这种统计效果不是收敛的(由图3E中相对于L的渐近水平曲线显示)。由于强制非常强,强制变量的内在动力学从属于强制变量,导致了被充分研究的“同步”现象(27)。图3E中的红色高原表明,在强强迫的情况下可以发生双向收敛。因此,必须排除强强制(同步),使CCM明确地暗示双向耦合,尽管它仍然暗示在公共动态系统中的成员关系。

传递性

  注意,因果关系是具有传递性的(例如,如果狐狸捕食兔子,兔子吃草,那么狐狸和草是有因果关系的)。更正式的说法是,无论X和Z是否直接互动,X⇔Y⇔Z暗含着X⇔Z。同样,对于单向的强迫,也有X⇒Y,Y⇒Z暗含着X⇒Z。可传递性为将CCM扩展到更大的交互网络提供了基础,使我们能够区分耦合的变量与共享一个共同驱动程序的变量。下面的两个模型示例说明了这一点。

复杂的模型例子:非耦合变量的外部强迫

  考虑这样一种情况:两种物种X和Y不相互作用,但都是由共同的环境变量Z驱动的(图4A中的例子1示意图)。这在生态系统中很常见,在因果关系的研究中仍然存在问题。在这里,我们认为物种X和Y之间没有交叉映射,因为变量之间没有信息流;然而,关于外力变量(Z)的信息仍然可以从X和Y中恢复。

  例如,在渔业中,由于有利的环境条件而具有共同的高峰采伐年的非相互作用种群即使没有相互作用也可能是相关的。 图4B中的简单渔业模型说明了这种情况,尽管物种之间的显着互相关表明它们可能是耦合的,但是交叉映射显示没有收敛的迹象,证明了它们没有耦合。 这表明CCM可以将真正的交互作用与共享驱动变量产生的简单相关性区分开

  图4C提供了具有更复杂的五种模型的方法的有趣的进一步说明[图4A中为示意图,(26)中为模型细节]。 在此示例中,种类1、2和3代表相互作用的环境,即外部作用于种类4和5,而种类4和5不影响任何其他种类。 物种1、2和3与上面的讨论中的Z相似,其中4和5与外部所有y强制非耦合对X和Y相似。图4C显示,CCM能够推论正确的相互作用网络,从而使所有双向 和单向链接正确。
在这里插入图片描述

现实世界的例子:用生态数据进行演示

  记住,从真实数据构造的吸引子是发生在更高维度的动态的近似。因此,尽管观测误差和过程噪声将限制可达到的收敛水平,低维近似仍然可以产生显著的因果效应的交叉地图估计。
在这里插入图片描述

  1. 一个实验捕食者-猎物系统的双向因果关系
      我们将分析应用于经典的实验捕食者-猎物系统的时间序列,该系统最早由Gause在20世纪20年代研究,后来由Veilleux改进,涉及Didinium(捕食者)和Paramecium(猎物)[方法细节见(26)]。
      图5A的结果表明是双向耦合(情况一),这与已知的情况一致。此外,草履虫时间序列中Didinium的交叉定位技能水平高于反向(图5B),表明捕食者Didinium的自上而下控制强于猎物草履虫的自下而上控制。这一发现与实验方案一致,并说明了不对称的双向耦合(案例i)。
  2. 沙丁鱼-凤尾鱼系统中的复杂因果关系
      这里,我们研究了太平洋沙丁鱼(Sardinops sagax)的着陆,北凤尾鱼(Engraulis mordax)的着陆,以及在加州斯克里普斯码头和新港码头测量的海表温度(SST)之间的关系(图5C)。
      竞争性的假说已经被提出来解释沙丁鱼和凤尾鱼在几十年时间尺度上在全球渔业的交替优势模式。尽管观测到的互反丰度水平(图5A)与生态竞争作为一种潜在机制相呼应,但沙丁鱼和鳀鱼节的全球同步表明,大规模环境强迫与最佳温度水平的物种-物种差异相结合的运作。最近的证据表明,这些系统的类制度行为表明非线性过程的运作。
      与全局模式相似的是,20世纪在加州,太平洋沙丁鱼和北部凤尾鱼的数量下降时,其中一个数量达到峰值。尽管有些人假设物种是在直接竞争中行动的,但另一些人认为物种对普通大规模环境强迫的反应不同。此外,以Santa Barbara盆地缺氧沉积物中保存的鱼鳞为基础的古生态时间序列显示,20世纪的负相关在这些较长的时间序列中消失了。与环境因素的相关性也一直难以捉摸。Jacobson和MacCall使用了两种方法,一种是广义相加模型,另一种是线性化的Ricker鱼群补充模型(含环境条件),并检测了Scripps Pier SST与沙丁鱼补充和产卵鱼群大小之间的3年平均运行时间的相关性。然而,当分析扩展到包括最近的股票评估从1992年到2009年,这种关系消失了。虽然有许多可能的解释,但这种行为与非线性动力学和海市蜃楼相关是一致的。

  我们使用同样的分析方法来解决这个争议(26)。图5D的结果显示沙丁鱼和凤尾鱼之间没有显著的交叉图信号,说明沙丁鱼和凤尾鱼之间没有相互作用。此外,正如预期的那样,在温度管汇中没有发现沙丁鱼或鳀鱼的可检测特征;显然,沙丁鱼和凤尾鱼都不会影响海温。然而,沙丁鱼与海表温度之间、鳀鱼与海表温度之间存在明显的不对称CCM(图5,E和F),这意味着温度信息在两个渔业时间序列中都进行了编码。可恢复的温度特征揭示了温度与沙丁鱼和凤尾鱼的弱耦合。因此,虽然沙丁鱼和凤尾鱼实际上并没有相互作用,但它们受到一个共同的环境驱动力的微弱影响,温度至少是一个可行的代理。注意,由于传递性,温度可能是一组驱动变量的代理(即,温度可能不是最接近的环境驱动因素)。我们发现海温影响沙丁鱼和鳀鱼种群大小(图5,E和F),这与Jacobson和MacCall的早期发现一致。附件提供了与渔业无关的其他数据的支持证据(图。S3和S4)。

  最后,值得注意的是,温度对沙丁鱼种群的可测量非线性耦合意味着温度的影响随系统状态而变化。因此,与目前对沙丁鱼的管制框架相反,一个固定的温度指数将不足以作出健全的管理决定。相反,需要一个涉及温度的动态(状态相关)规则。

关于不可分离性的最后评论

  这项研究的基本观点之一是,当因果关系是单方面的时,X ⇒ Y(" X驱动Y "就像案例Ⅱ一样)那么可以从Y来估计X,但不能从X来估计Y。这与直觉(和GC)背道而驰,并表明如果天气驱动鱼类数量,例如,我们可以使用鱼类来估计天气,但不能反过来。

  进一步澄清这是如何工作的,考虑前面描述的生态物流模型(Eq.1)。我们可以通过重新排列恢复交叉映射动力学代数Eq.1给表达式Y (t) 和 X (t),用这些回Eq.1,解决X (t)代替Y (t),Y (t - 1)(反之见附录S1)。

  在这些表达式中,参数β(x, y)支配X对Y变化的敏感性,当β(x, y)接近0,X单方面驱动Y(案例ii), X的交叉映射估计仍然表现良好。但是当β(x, y)时,Y的交叉映射模型有一个奇异点,这意味着交叉映射允许从驱动变量重构驱动变量,但不能反过来重构驱动变量(鱼反映天气状态,但不能反过来)。

  最后,因为Eq.1(参数化的fig.1)可以作为一个模型代数重新安排X (t + 1)代替X (t) 和 X (t - 1),从Y变得冗余的信息,可以删除不影响我们的能力来预测X (t + 1)。因此,GC会结束(错误地)导致Y不是由X产生的结果 (GC计算S1)。

结论

  尽管伯克利在1710年的《论人类知识原理的论文》中提出了一些基本问题,相关性仍然是现代科学的分析标准。随着越来越多的人认识到非线性动力学无处不在,这已经变得越来越难以证明。在非线性系统中,变量之间的明显关系可能由于海市蜃景相关性或区域的阈值变化而自发地转换,而相关性可能导致不正确和矛盾的假设。越来越多的人认识到非线性行为的普遍性和重要性,要求有一个更好的标准来评估不可能进行实验操作的原因。

  格兰杰因果关系以预测而非相关性作为时间序列因果关系的标准来解决伯克利的问题。这个想法假设原因可以与结果分开,因此,如果在删除变量时预测技能下降,则将变量标识为因果关系。在纯粹的随机世界中,这是可能的,并且对于可以作为独立零件进行研究的系统而言,这是一个强大的想法。但是,它并没有针对所有系统进行定义,尤其是没有针对采用Takens定理的确定性动态系统(甚至是嘈杂的系统)进行定义。为了解决这个问题,我们研究了一种利用不可分性的方法,该方法通过使用CCM来测试常见动态系统的成员资格。 CCM不是与GC竞争的方法,而是处理通常在GC中根本不适用的生态研究中经常发现的相互依赖性。因此,毫不奇怪,作为进一步检查,这项工作中考虑的所有模型和实际数据示例的GC计算在很大程度上都没有成功(表S2和GC计算S1至S5)。

  尽管存在许多物种相互作用的经验度量(例如,从饮食矩阵推断相互作用代理),但我们认为,从时间序列信息推断的因果关系提供了一幅相互作用的“底线”图,这比可能与代理的关系更直接。从它们的动态行为中解析因果网络的能力对于系统识别和基于生态系统的管理具有重要意义,特别是在了解哪些物种作为一个群体相互作用并需要被共同考虑的情况下。在资源管理中,象在其他地方一样,对因果网络的准确了解对于避免管制行动的不可预见的后果是必不可少的。

  • 8
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值