功能连接分析方法及其解释缺陷的综述

文章来源于微信公众号(茗创科技),欢迎有兴趣的朋友搜索关注。

本文是一篇关于功能连接分析方法及其相关注意事项的综述,于2016年发表在Frontiers in Systems Neuroscience。

振荡神经元活动可能为动态网络协调提供一种机制。节律性神经元的交互作用可以使用多种指标进行量化,每种指标都有各自的优缺点。本篇文章将回顾和总结目前在侵入性和非侵入性电生理学领域使用的分析方法,以研究神经元群体之间的动态联系。首先,本文回顾了功能连接的相关指标,包括相干、相位同步、相位斜率指数和格兰杰因果关系,其具体目标是为这些指标的工作原理及其定量定义提供一种直观的理解。其次,作者强调了在执行功能连接分析时可能出现的解释上的注意事项和常见陷阱,包括参考问题、信噪比问题、容积传导问题、输入问题和样本大小偏差问题。最后,这些缺陷将通过一组matlab脚本模拟来进行说明,读者可以执行这些脚本来模拟每一个潜在的问题。本文讨论了如何使用当前的方法来解决这些问题。

引言

不同的认知或知觉任务需要在功能特定的大脑区域网络中协调的信息流。有人认为,神经元振荡提供了一种潜在的大脑动态协调机制。这些振荡可能反映了局部神经元集合同步的有节律的兴奋性波动,当这些节点之间的振荡同步时,可能会促进神经信息在网络节点之间的流动。从一个区域传递到另一个区域的神经信息是由动作电位反映出来的,在这种情况下,动作电位本身可能会短暂地以突发(bursts)形式组织起来。这些突发可能发生在振荡期间,并可能进一步增强信息传输的可靠性或有助于建立远程同步。大脑可以通过改变不同大脑区域同步振荡的强度、模式或频率来动态地协调信息流。

一般来说,神经元振荡,特别是这些振荡的区域间同步性,是正常大脑功能的工具,这一假设导致了在电生理数据中定量评估神经元同步性的广泛应用。这些数据可以在一个涉及实验操作或在一个无任务的环境中,通过侵入性或非侵入性记录技术获得。无论是什么记录技术和背景,一旦收集数据,实验研究人员面临的挑战是量化神经元的交互作用,并提供关于该发现的有效解释。我们有几个原因认为这具有挑战性。首先,文献提供了大量的指标来量化振荡交互作用 (例如,最近Wang等人(2014)的一篇综述描述了42种不同的方法),通常用大量的技术细节进行描述。一些方法,比如相干和格兰杰因果关系是基于严格的随机过程统计理论。而其他,如锁相值(Phase-Locking Value, PLV)等方法则是对这些方法的修改,可能有些特别,但仍然有用。每一个指标都有自己的优点和缺点,也都有自己的坚定拥护者和反对者。选择和证明使用哪一种方法常常是困难的,即使对技术初学者来说也是如此。其次,由于特定交互指标算法的实现可能相当复杂,一些研究小组可能对他们倡导的交互度量有特殊的实施方式,这限制了更广泛的研究社区的可访问性。这使得这些特定指标的适用性和与其他指标的比较变得复杂。第三,对研究结果的解释通常是不直接的,因此结果容易被过度解释。

本文的目的是为量化振荡交互作用的最广泛使用的指标提供一个(非详尽的)回顾和教程,并为读者提供对这些指标的直观理解。首先,我们提供了评估功能连接的一般标准分类。接下来,我们为最常用指标提供更正式的定义,并在可能的情况下使用直观的示例说明这些指标背后的原则。在最后一部分中,我们讨论了在将这些方法应用于实际数据时可能遇到的各种分析陷阱。通过模拟,我们生成了合成时间序列,以演示产生虚假的功能连接后如何产生大量的实际问题,而这些问题不应该用潜在的神经元交互作用来解释。我们讨论的不同问题是信噪比(signal-to-noise ratio, SNR)的差异,样本大小的限制,容积传导/电磁场扩散,参考点的选择,以及未观测到的输入问题。合成时间序列的生成及其分析已经在MATLAB中使用FieldTrip进行,这将能够比较不同的数据特征如何影响振荡交互作用的指标,以及不同的指标如何在相同的数据上进行运算。对于每个常见问题的模拟,我们提供了可用于减轻问题的实际步骤。这些模拟是作为一些可能发生的问题的例子提出的,并不是为了再现真实数据的全部复杂性。然而,我们希望它们将成为一个有用的指南,以了解公共解释问题和目前处理这些问题的技术状况。最后,我们还讨论了未来方法在哪些方面可能有用,以便处理当前方法的局限性。

功能连接指标的分类

图片

图1:量化功能连接的常用方法分类

在这一部分,我们呈现了功能连接的常用度量方法的分类(图1),并简要描述了每种方法的主要假设和应用。可以进行的第一个细分是看度量是否量化了交互的方向。无向(non-directed)的功能连接度量寻求捕捉信号之间的某种形式的相互依赖,而不考虑影响的方向。有向(directed)的功能连接度量寻求从数据中建立一个统计上的因果关系,这个统计因果关系是基于原因先于结果的准则,并且在格兰杰因果关系和转移熵的情况下,原因以某种方式预测它们的影响。统计因果关系的定义最初是由Wiener(1956)提出的,后来由Granger(1969)使用自回归模型实际实现。在神经科学领域,使用这些特定方法来量化神经元交互作用的文献越来越多,在其他地方也有对这些文献的回顾。

在有向和无向度量类型的基础上,可以进一步区分为无模型(model-free)和基于模型(model-based)的方法。基于模型的方法假设两个信号之间可能发生的交互作用是线性的。度量无向的基于模型的交互作用,最简单的度量指标是皮尔逊相关系数,它度量两个随机变量之间的线性关系。在一般的线性建模框架中,平方相关系数(R2)代表一个变量(或信号)的方差中可以用另一个变量来解释的部分。一种不假设线性关系的更广义的方法是互信息,它使用信息论的概念来测量两个或多个变量(或时间序列)之间的广义(线性和非线性)相互依赖。

皮尔逊相关系数和互信息本身是交互作用的非定向度量指标,这些指标忽略了数据中的时间结构,并将时间序列视为随机变量的实现。换句话说,无论时间序列是否随机打乱,后一个属性估计的连接性都是相同的。然而,当我们在计算相关性之前将两个时间序列移动时(并在多个滞后进行这种移动),我们将获得互相关函数,而作为时间之后函数的互相关评估确实可以解释数据中的时间结构。特别是,在一些表现良好的情况下,它有时可以用来推断定向神经元的交互作用。具体地说,互相关函数已经被有效地用于研究具有主导单向交互作用的神经元系统,这些交互作用在特定的时间延迟中发挥着最大的影响(例如,视网膜-膝状体或膝皮质前馈通路)。在这种情况下,最大相关的时间延迟和相关的幅度可以提供关于大脑区域之间的信息流的信息。然而,当从具有双向交互作用的神经元信号中估计互相关函数时,互相关函数的解释变得复杂,这是大多数皮质-皮质连接中的主要交互作用情况。这些交互作用的互相关函数通常没有清晰的峰值,并且在正滞后和负滞后都有显著的值,表明在多个延迟处发生了复杂的双向交互作用。

为了解决这个局限,可以使用其他方法。格兰杰因果关系(Granger causality)是基于有向模型的度量方法,它评估一个时间序列的过去值在多大程度上能够预测另一个时间序列的未来值,反之亦然。这个概念在格兰杰因果关系的度量中得到了正式的实现。它可以使用适合于数据的线性自回归模型或者通过非参数谱矩阵分解来计算,并且可以对有向交互作用进行估计。特别是,它允许分开估计从信号x到信号y以及从信号y到信号x的交互作用。

最后,还发展了无模型方法来检测有向交互。例如,转移熵(transfer entropy)是一种研究时间序列间延迟(有向)交互作用的广义信息论方法。转移熵是原因必须先于预测其影响这一准则的更一般的实现,并且能够检测非线性形式的交互作用,这对于像格兰杰因果关系这样的线性方法来说是不可实现的。此外,转移熵还被扩展到专门测量正在进行的独立信号相位估计之间的有向交互作用,这对于研究非线性振荡同步是有用的。然而,虽然无模型方法可能有助于量化非线性神经元交互作用,但本综述将侧重于基于模型的线性方法。在振荡相位耦合支配神经元交互作用的假设下,线性方法足以捕获大量的振荡交互作用。例如,如果我们有兴趣确定在大脑区域A和B中相似频率的神经元振荡是否与偏好的相位差发生振荡耦合,线性测量如相干或PLV将捕捉到这种交互作用。另一方面,如果我们对非线性形式的耦合感兴趣,例如跨频率耦合(频率f1的相位或振幅与频率f2的相位或振幅交互作用,其中f1≠f2),那么就需要其他指标。因此,方法或数据分析的选择应该始终以当下的基本假设为指导。

如果我们想要研究振荡,一个特别重要的区别是指标之间的区别,这些指标是从信号的时域或频域表征中计算出来的。为了识别构成测量数据的单个节律分量,并专门研究节律神经元的交互作用,它们通常可以很方便地表征频域的信号。通过应用非参数(傅立叶分析、小波分析或带通滤波后的希尔伯特变换)或参数技术(自回归模型)可以实现频域的变换。随后,通过频域功能连接指标来评估神经元间的交互作用。正如我们将看到的,其中许多指标以某种方式或另一种方式量化了信号中振荡分量之间的相位差观测结果的一致性。相位差的非随机分布可能表明神经群体之间有意义的功能的同步。

我们还注意到,有一组不同的方法,纯粹是基于振幅(包络)的振荡来量化振幅和功率相关性,而不依赖于相位关系。这些方法已被多个组织有效地应用于量化大规模脑网络。事实上,现在关于相位关系或振幅关系是否控制大规模脑网络的争论越来越多,两种观点都有相应的证据(见Foster等人的这个问题)。在下一节中,我们将重点关注需要估计振荡相位的频域指标,而不是量化振幅关系的指标。同样,方法选择取决于当下的基本假设。基于相位的方法适用于那些相位和时刻同步变化被认为是神经元通信机制的假设。我们不会回顾量化相位振幅耦合的方法,因为它们超出了本文的范围,并已在其他地方广泛讨论。

同步的测量

一般来说,相位同步的测量是从一对信号的频域表征来计算的,这对信号表示一组观测值(分段或时间窗),对于一组频率仓而言,则是对振荡振幅和相位的估计。从数学上来说,将这些振幅和相位组合成复数值Aeiϕ,或等效的x + iy是很方便的,这些复数值可以在几何上表示为二维笛卡尔坐标系中的点,其中连接点与原点的向量的大小反映了振幅,向量与x轴的角度反映了相位(见图2A;这个数的x和y坐标分别代表实部和虚部)。通过将一个信号的频谱表征与另一个信号的频谱表征的复共轭按频率相乘,组合各个信号的频谱表征以获得交叉频谱密度(交叉协方差函数的频域等效物),其中复共轭被定义为相位角的负数。这种乘法产生了一个复数,它在二维空间中以几何方式描绘了一个矢量,其中矢量的大小反映了两个信号振幅的乘积,矢量和X轴之间的角度反映了两个信号的相位差(见图2B)。相位同步的测量旨在捕捉单个观测交叉谱密度的概率分布的一些特性,量化相位差分布的一致性。组合交叉谱密度的一种方法是取一个加权和,这在几何上相当于从头到尾画出所有向量,并对最终结果进行标准化。现在的想法是,如果两个振荡信号之间的相位差观测值之间存在某种一致性,加权和的长度将是非零值(因为向量有效地相加),而当单个观测值的相位差均匀分布在0°和360°之间时,加权和的长度将接近零。图3展示了三个“场景”来说明这个概念。设想两个振荡器在许多试次或观测周期中具有一致的零度相位关系。图3左侧面板的时域中以图形方式进行描述,显示了在四个试次中观察到的两个信号(振荡1和振荡2)。图3的右侧面板显示了交叉光谱密度的矢量和。目前,我们假设振荡的振幅值为1。第一种情况(图3A)对于每个观测值,相位差是相同的(和为0),产生长度为4的矢量和。在第二种情况下,相位差在不同的观测值之间也是一致的(即每次相差90°)。然而,在第三种情况下,不同观测值之间的相位差并不一致。在本例中,单个观测值的相位差分别为0°、90°、180°和270°,导致单个观测值的交叉谱密度矢量指向右、上、左和下。这导致矢量和的长度为零,这与在这种情况下没有一致的相位差的事实相一致。请注意,即使由于样本大小偏差而没有任何真正的相位同步,实际数据也将处于完美相位同步(矢量和等于1)和零相位同步(矢量和等于0)的两个极端之间。

图片

图2:用极坐标和复数表示频域信号。(A)两个信号的相位和振幅。(B)信号1和信号2之间的交叉谱,相当于将两个信号的振幅相乘并减去它们的相位。

图片

  图3:相位同步的计算机制。(A) 0弧度完美相位同步的实例。(B) π/2弧度差的完美同步实例。(C) 由于不一致的相位差,没有相位同步。

相干系数

一种广泛使用的用来量化一对测量信号之间相位同步的指标是相干系数。在数学上,相干性是等效于时域互相关函数的频域。其平方值作为频率的函数量化了一个信号中可以由另一个信号解释的方差量,反之亦然,类似于时域中的平方相关系数。相干系数是一个以0和1为界的标准化量,数学计算如下:

图片

分子项表示频率ω下信号x和y之间的单个试次交叉谱密度的矢量平均值的长度。分母代表频率ω下信号x和y的单个试次功率估计值的平均值乘积的平方根。

在单个矩阵中表示平均交叉谱密度通常更方便,在符号中省略了复数指数:

对角元素反映信号x和y的功率估计,非对角元素反映平均交叉谱密度项。相干可以被简明地定义为:

相干和相位差谱斜率

当幅值运算符(|. . . |)从上述等式的分子中省略,我们获得了一个称为相干的复数值,其中相位差角度可以用时间延迟来解释(如果在试次中有明显的相位差聚类角度)。这是基于这样一个概念,即在一系列频段上,一致的相位滞后(或超前)转化为两个时间序列之间的时间滞后(或超前)。请注意,单个频率仓中的相位差估计值在其解释中可能不明确,因为例如-150°相位延迟无法从+210°相位延迟中分离出来。这是因为相位差是圆形模360°。然而,观察一个频率范围内的相位差可以给出时间延迟的明确解释。当有节律的交互作用可以被描述为主要是单向时滞线性交互作用时,可以获得对时间延迟的明确估计。然后,该估计基于相位差斜率的估计,其作为频率范围的函数,在该频率范围中存在基本的相干。这是因为两个时间序列之间的固定时间延迟会导致相位差,相位差是频率的线性函数。例如,考虑10ms的时间延迟和在8和12Hz之间的频率范围内具有相当大的振荡功率的节律过程。在8Hz下,即在125毫秒的周期持续时间下,10毫秒的时间偏移相当于振荡周期的10/125 (0.08)(其相当于28.8°)。在10赫兹时,相同的时移相当于振荡周期的10/100(36°),在12赫兹时,10毫秒的时移相当于振荡周期的10/83.33(0.12)(43.2°)。然而,我们要强调的是,根据时间延迟,对相位差谱估计斜率的解释仅在相当理想的情况下有效,在这种情况下,交互作用主要是单向的,并且能在线性假设下很好捕获到。在非理想情况下,相位差谱是一个复杂的频率函数,单独用它来指定方向性是不符合原则的。

相位斜率指数

相位差谱的斜率假设存在时滞和线性交互作用,相比之下,相位斜率指数(PSI)是推断显性单向交互作用的一个更通用的指标。它是根据复值相干性计算的,并量化了频率间相位差变化方向的一致性。给定一个预先指定的带宽参数,它计算每个频域相邻频域之间相位差的变化,并对相干加权。因此,如果在给定的频带范围内,频率之间的相位差有一致变化,并且存在实质的相干,PSI将偏离0。PSI的符号表示哪个信号暂时领先于另一个信号。如之前所述,在交互作用是双向的情况下,相位差谱(以及PSI)可能无法正确描述方向性。关于这一点的进一步讨论,请参考Witham等人 (2011)和Vinck等人(2015)。

相干虚部

当复值相干性被投影到虚轴(y轴)上时,我们得到相干性的虚部。该方法在过去几年中取得了一些进展,特别是在EEG/MEG连接性研究中。摒弃对沿实轴的连接性估计的贡献,明确地消除了由于场扩展而导致的可能是虚假的瞬时交互作用,如在后面的部分深入讨论的那样。

锁相值

当将计算相干的公式应用于振幅标准化傅立叶变换信号时,我们得到锁相值(PLV) :

作为这些单个观测标准化的结果,PLV被计算为一组单位长度相位差估计的矢量平均值的长度。在推动使用PLV时,与相干相反,人们经常声称前者反映了比相干更严格的相位同步,因为后者混淆了相位差与振幅相关的一致性。从数学的角度来看,这可能是正确的,但另一方面,人们可以认为,与没有振幅相关性时相比,在没有一致相位差的情况下,获得有意义的非零相干值更“困难”。直观地说,当所有的单个观测交叉谱密度估计都指向随机方向(没有相位同步)时,即使存在完美的振幅相关性,它们的向量平均值的期望值仍然会相对较小。另一方面,如果所有的单个交叉谱密度估计或多或少都指向同一个方向(强相位同步),即使没有振幅相关,它们的矢量平均值的期望值仍然是可观的。此外,一方认为,在相干性的情况下,对具有大振幅乘积的观测值赋予更大的权重,一方倾向于那些有高质量相位差估计的观测结果。这实际上假设了较高的振幅反映了感兴趣的源的较高信噪比,从而反映了较高质量的相位估计。

量化一致相位差的其他方法

除了前面描述的指标外,在过去的几年里,已经定义了各种其他指标来量化神经元信号之间同步的交互作用。开发这些指标的动机是,大多数连接性指标都存在解释上的困难。这些困难(将在下文进行详细讨论和说明)促使方法开发人员来定义不太容易出现这些问题的指标。我们已经讨论了相干虚部和相位斜率指数,本节描述了两个越来越流行的额外指标,相位滞后指数(phase lag index, PLI)和成对相位一致性(pairwise phase consistency, PPC)。

PLI是一种指标,用于评估观测值之间的相位差分布,它是通过平均观察到的估计相位差的信号来计算的。它的假设是非零相位差不能由场扩散引起(就像相干的虚部和PSI一样)。最近,有人提议对PLI进行一些调整,得到加权PLI和去加权PLI,以使该指标对场扩散、噪声和样本大小偏差等问题更加稳健。

PPC是一种量化观测值间相位差分布的指标。与PLV不同的是,它是作为观测值之间相对相位的矢量平均值直接计算的,而相位相关系数是根据相对相位的所有成对差异(观测值对之间)的分布计算的。这背后的想法是,类似于直接研究相对相位分布的情况,在有相位同步的情况下,相对相位的两两差异分布将更强烈地聚集在一个平均值周围。当不存在相位同步时,单个相对相位矢量分布在单位圆上,这些相对相位矢量的所有成对差异也是如此。PPC优于PLV的点在于,该指标不受用于估计的样本量的影响。这意味着PPC的期望值不会随着试次数的变化而变化(详见样本量偏差问题一节)。

从本质上说,许多被提及的指标并不是基于有原则的数学方法(与之相反的是,例如相干和格兰杰因果关系,它们根植于随机过程理论)。例如,PLI、相干的虚部和相位斜率指数是主要为解决场传播的解释问题而提出的实用指标,其设计意图是捕捉时间序列之间交互作用的类似特征。关于哪一种指标最适合使用,这往往是一个经验问题,理想情况下,人们应该有这样的预期,即得出的结论并不强烈地依赖于所选择的指标。因此,一般来说,建议使用这些指标来对数据进行分析,以便了解各个指标得出的估计之间如何相互关联。

超越成对交互

到目前为止,我们已经讨论了在信号对之间定义的连接性指标。然而,通常记录了两个以上的信号,这可能与更详细地研究多个成对交互的模式有关。为此,可以采用图论方法。这些方法建立在对连接性进行有效量化的基础上,在其他地方有广泛的讨论,但超出了本综述的范围。这里将它作为下一节的前奏,在下一节中我们将讨论公共输入的问题。一般来说,关键问题是在其他(可能未观察到的)源存在的情况下对直接交互的正确推断。虽然潜在的、未观测到的信息源构成了一个根本的、无法解决的问题,但已经观测到的信息源的信息可以用来消除其对连接性估计的间接影响。在相干分析的背景下,其中一种方法是使用部分相干。如果记录了多个信号,就可以对任何信号计算所谓的部分交叉谱,这是通过从所有其他信号中去除线性分量而获得的。从部分化的交叉谱,可以容易地获得部分相干性。可以获得如下部分化的交叉光谱。从全交叉光谱密度开始:

图片

我们可以将信号z1-zn对信号x和y之间的交叉谱的线性贡献划分如下:

图片

尖峰场相干

利用侵入性电生理信号,可以记录来自单个神经元或神经元簇的动作电位。在这种情况下,检查同时记录的LFP或EEG中正在发生的振荡如何与尖峰信号相关联可能会有所帮助。为此,在与连续的LFP/EEG信号相同的采样率下,来自给定单元的尖峰可以表示为1和0的时间序列(注意,可以将尖峰表示为尖峰次数的向量,这有时会导致数据的稀疏表示)。一旦选择了合适的尖峰表示,我们就可以计算尖峰和场之间以及不同尖峰序列之间的同步的指标。这通常可以揭示与场振荡相关的尖峰时间的显著调节(例如,显著的尖峰场相干),这也可能对任务变量敏感。 进行尖峰场分析有很多注意事项和挑战,这超出了本综述的范围(感兴趣的读者可以参考Vinck et al., 2012; Ray, 2015)。

格兰杰因果关系的频率解析、有向交互作用的量化

截止目前,我们已经回顾了功能连接的相关指标,这些指标是基于有带宽限制的振荡信号分量相位差的符号来推断交互的方向性。然而,这些技术的实际应用仅限于时间滞后且主要是单向交互的情况。格兰杰因果关系和相关度量能够量化双向交互作用,并为给定的信号对提供两种有向连接性估计,分别量化信号x对信号y的定向影响和信号y对信号x的定向影响。最初,格兰杰因果关系的概念被应用于经济学领域的时间序列数据,并由Geweke(1982)提出将这一概念扩展到时间序列的频域表征。虽然存在优秀的介绍性文本,解释频域格兰杰因果关系的概念及其在神经科学数据中的应用,但我们在附录(补充材料)中简要回顾了一些基本概念的细节。在这一点上,我们只谈必要的点。

时域公式

本质上,格兰杰因果关系代表了模型比较的结果。它植根于自回归(AR)建模框架,其中时间序列的未来值被建模为时间序列的过去值的加权组合。具体来说,增强现实模型的质量可以通过模型残差的方差来量化,格兰杰因果关系被定义为残差方差比率的自然对数,从两个不同的AR模型中获得。其中一个模型是单变量自回归模型,其中时间序列x的值被预测为时间序列x的过去值的加权组合。另一个模型是双变量自回归模型,其中时间序列x的值不仅基于x的过去值,还基于另一个时间序列y的过去值被预测。将单变量模型与双变量模型进行比较,残差方差的显著减少意味着在信号x的预测中包含有关信号y过去值的信息(超过仅包含信号x的过去值),可以得到一个更好的时间序列x模型。在这种情况下,如果方差比大于1,这导致格兰杰因果关系值大于0,信号y被称为引起信号x的格兰杰原因。应用相同的逻辑,建立自回归模型来预测信号y,将产生从信号x到y的格兰杰因果关系的估计。

频域公式

格兰杰因果关系的概念也可以在频域中操作。有兴趣的读者请参阅附录(补充材料和其中提到的参考资料)了解更多细节。在频域中计算格兰杰因果关系需要估计两个量就足够了:依赖于频率的谱转移矩阵(H(ω))和AR模型残差的协方差。以下基本等式成立:H(ω) ∑ H(ω)* = S(ω)。其中S(ω)是频率ω下信号对(x,y)的交叉谱密度矩阵。换句话说,共轭对称交叉谱密度可以通过将残差的协方差矩阵夹在谱转移矩阵之间来获得。从交叉光谱来看,频谱转移矩阵和残差协方差矩阵依赖于频率的格兰杰因果关系可以得到如下计算:

图片

频域格兰杰因果关系与相干的关系

正如在格兰杰因果关系的时域公式中一样,基于交叉谱密度估计,我们有可能定义一种完全相互依赖(total interdependence)的衡量标准(更多信息见附录):

 

 

括号中的分数等于相干系数的平方,如前一节所示。换句话说,相干系数和完全相互依赖之间存在一一对应的关系。与时域公式类似,频率特定的完全相互依赖可以写成三个量的总和:GCx,(ω) = GCx→y(ω) + GCy→x(ω) + GCx···y(ω),其中瞬时因果项定义为:

 

后一项反映的是信号x和y之间的时滞(相移)相互作用无法解释的全部相互依赖的部分,反映了来自潜在源的瞬时公共输入。注意,在零相位滞后同步的情况下,瞬时因果项不一定比因果项大。具体来说,在具有双向交互作用的系统中,传递函数的幅值和相位延迟在两个方向(即从x到y和从y到x)上近似相等,交叉谱密度矩阵可以反映零相位延迟下的强同步,但这是由两个方向上的强时滞因果交互作用引起的。然而,需要注意的是,理论工作指出,在存在第三源的动态继电器的情况下,零滞后相位耦合更有可能发生,第三源提供公共输入来稳定零滞后时整个网络的相位关系。实际上,只有当具有零滞后同步的两个节点与可能(或可能不)提供公共输入的第三个节点同时观测时,这种情况才能与纯粹的双向交互区分开来。关于这种情况以及如何在生理数据中检测它的更多细节,请参见“常见输入问题”一节。

格兰杰因果关系的非参数参数计算

 图4:使用参数或非参数方法计算格兰杰因果关系的数据处理流程图

频域中的格兰杰因果关系可以用参数方法(如图4左半部分所讨论的自回归模型)或非参数方法(基于傅立叶或小波的方法)来计算。这些方法的不同之处在于如何计算残差协方差和传递矩阵(见图4的右半部分)。非参数方法基于以下事实:给定频率的交叉谱密度矩阵等于夹在该频率的传递矩阵之间的模型残差协方差矩阵,如上所述:

从交叉谱密度矩阵开始(因此向相反方向),通过应用谱矩阵分解,可以将交叉谱密度矩阵分解为噪声协方差矩阵和谱转移矩阵,为计算格兰杰因果关系提供了必要的成分(见公式4)。已有研究表明,格兰杰因果关系的参数和非参数估计产生了相当的结果,特别是在性能良好的模拟数据中。

使用这种非参数方法计算格兰杰因果关系的主要优点是,它不需要确定自回归模型的模型顺序。选择特定的模型顺序可能是有问题的,因为它可以根据主题、实验任务、数据的质量和复杂性以及所使用的模型估计技术而变化。相比之下,格兰杰因果关系的非参数估计使用来自整个频率轴的数据点,其数量基本上由用于分析的数据窗口中的样本数量决定。

与参数估计方法相比,非参数谱分解方法需要更多的数据和交叉谱密度的平滑形状(没有作为频率函数的尖峰)来收敛达到稳定的结果。当试图从单试次中计算格兰杰因果关系时,这一点最为明显。尽管参数和非参数方法都可以用于有向连接性的单试次估计,但参数估计似乎比非参数估计更敏感,尤其是当模型阶数已知时。

二元 vs 多元谱分解

值得注意的是,在多通道记录中,谱转移矩阵可以通过两种方法获得,无论它是由拟合的自回归模型计算的,还是通过非参数谱密度估计的因子分解获得。可以拟合一个完整的多元模型(或等价地,做一个多元频谱分解),其中所有的通道都被考虑在内,或者可以分别对每个通道对进行分析。后一种方法通常会产生更稳定的结果(例如,因为它涉及到更少的参数拟合),但前一种方法的优点是,在估计任何一对源之间的交互项时,会考虑来自所有渠道的信息。通过这种方式,人们可以尝试使用格兰杰因果关系的扩展公式,即部分格兰杰因果关系或条件格兰杰因果关系。此外,多元方法产生一个光谱转移矩阵,可以用来计算一组连接指标,这与格兰杰因果关系相关。这些指标是有向传递函数(DTF)及其相关指标,以及部分有向相干(PDC)及其相关指标。对这些指标进行了标准化,在0和1之间取值,其中标准化因子定义为沿着光谱转移矩阵的行(DTF)的和,或者沿着光谱转移矩阵的逆列(对于PDC)的和。由于这些标准化,从信号y到x的DTF反映了从y到x的因果流入,作为信号x的总流入比率,而在其原始公式中,从信号y到信号x的PDC反映了从y到x的因果流出,作为信号y总流出比率。这些指标及其派生指标,以及偏爱一个指标而不是另一个指标的动机,将在例子中进行更详细的讨论。

功能连接方法的局限性和常见问题

以下部分概述了在解释连接性时需要谨慎对待的一些问题。关键的核心问题是连接性的估计是否反映了神经元交互作用(变化)的真实效应。正如我们将通过简单的模拟来说明的那样,在缺乏真正的神经内部活动的情况下,存在多种情况会导致对连接性的非零估计。在MEG/EEG/LFP记录中,用于连接性估计的信号总是(有时候很差)在某种程度上反映了感兴趣信号和不感兴趣信号(噪声)的混合。虚假估计的另一个原因与观察到的连接性模式的解释相关。这涉及到这样一个事实,即不可能说明观察到的联系是否是直接联系,或者这种联系是否是通过未观察到的连接来中介的。

在接下来的内容中,我们描述了五个常见的在解释连接性估计时需要谨慎的实际问题。我们使用基于matlab代码和FieldTrip工具箱的简单模拟来说明这些问题,让感兴趣的读者对这些重要问题有一些实际的了解。该代码已在MATLAB 2013a/b和2014a/b上进行测试,使用Fieldtrip - 20150816版本。前三个问题是由于测量信号总是由感兴趣信号和噪声的混合引起的,第四个问题是未观察到的公共输入的问题,第5个问题是由于在条件之间或不同被试之间进行比较时,用于计算功能连接性指标的分段数或观察周期的数量不相等造成的。

公共参考问题

图片

图5:不同参考方案的说明,以及在有和没有真正神经元耦合的情况下,每个方案如何影响相干性的计算。(A)单极记录的情况,在没有相干的情况下引入虚假的相干值。(B)双极推导技术,很大程度上解决了公共参考问题。(C)单独参考方案,对公共参考问题也不敏感。

在LFP或EEG记录中,使用公共参考通道可能会导致虚假的功能连接性估计。这个问题如图5A所示。假设两个记录的时间序列,数据1和数据2。这些信号中的每一个都反映了在电极位置和参考电极位置所测得的电势的差值。如果两个随后用于连接性估计的电极都使用同一参考电极,则参考位置的电势波动将在两个时间序列中反映出来,在零滞后的情况下产生虚假相关性。任何对零时滞相关性敏感的连接性指标,在一定程度上都是虚假的。估计的连接性在多大程度上是虚假的,取决于记录点和参考点电位波动的相对强度。显然,大部分EEG和LFP记录在硬件中使用单个参考电极。下面的模拟阐述了使用常见参考电极的影响。我们将在两个神经元源中模拟30—60 Hz的振荡活动,这种活动是由共用一个参考电极的两个电极测量的(该参考电极也假定有振荡分量)。我们将在潜在源之间存在和不存在耦合的情况下,估计测量信号之间的相干性。

在这个模拟中,我们假设了一个生成模型,它由各种源之间的线性混合组成,每个源都有一个在30—60 Hz范围内的振荡分量。独立的源被直接投影到相关数据中,由例如图5A中的源1和数据1之间的箭头表示。公共参考被视为一个共享信号,以相等的权重投射到每个数据通道(注意图5中R和每个数据通道之间的箭头)。源之间的耦合被模拟为一个共享信号,该信号以某种混合方式投射到每个源中。使用该生成模型,很明显,当源1和源2之间不存在真正的耦合时,由于公共参考,数据1和数据2之间存在显著的人工相干(图5A,红色轨迹)。这是一个问题,因为在没有任何潜在的神经元交互作用的情况下,任何连接性估计都应该接近于零。当源1和源2之间引入真实耦合时,如图5A所示,数据1和数据2之间的相干性增加,这反映了公共参考和实际耦合的存在。这个模拟是在假设源之间存在强耦合的情况下进行的。在弱耦合条件下,人为相干有时会占主导地位,掩盖由真实交互作用引起的真实相干。

解决这个问题的一种方法是记录额外的通道并执行双极推导以移除公共参考,然后计算不共享公共单极通道的局部参考双极推导之间的连接性(图5B)。例如,Bollimunta等人 (2009)和Bosman等人(2012)已经应用了这一程序,并依赖于两个假设:首先,参考在单极通道中同样存在,并且将被减去,其次,每一个单极通道反映了潜在神经元源的不同混合,通过双极推导消除公共参考背后的相同逻辑也会导致神经元信号的抵消。关于双极推导过程及其在神经数据中的应用的讨论,请参见Trongnetrpunya等人的研究。在图5B中,每个单极通道被描述为反映一个独立源的活动,但每个单极通道也可以反映潜在源的混合,并且应用相同的逻辑。在这个场景中,双极推导去掉了公共参考(参见图5B中的方程),得到的双极信号是两个本地源活动的相减。当现在直接在双极点1和双极点2之间计算相干性时,它不受公共参考的影响,如图5B所示:当源之间没有耦合时,相干性接近于零(接近程度取决于进行分析的试次数量和产生的偏差见样本大小偏差部分),但在耦合存在时,相干性达到0.5。

这个问题的第二个可能的解决方案如图5C所示,即对每个通道进行参考。在这种情况下(图5C),同样没有人工相干成分。因此,虽然分离参考方案在原则上提供了一种解决方案,但它可能不适用于大规模、高密度记录。以上模拟可以通过运行脚本sim_commonreference.pdf中的代码来实现。请注意,在这些模拟中,假设在参考中也存在一个的30—60 Hz振荡分量,然而,如果参考包括白噪声,或白噪声和有色噪声的混合,和相干性计算通道之间有一个公共的参考,然后,由于其瞬时混合到两个通道中,各自的相干谱将反映参考的基础谱形状。

积传导/场扩散问题

在量化和解释神经元交互作用中,另一个重要问题是由容积传导引起的,特别是基于非侵入性记录进行估计时。严格地说,容积传导是指在活动神经元源周围的组织中流动的电流。通俗地说,它已被作为一个术语来反映电磁场的空间弥散现象,这种现象导致了一个记录通道或传感器捕捉到多个神经元源的活动。在磁场记录的情况下,有时称它为磁场扩散更为恰当。在最糟糕的情况下,磁场传播可以产生纯粹的人工相干或锁相,这意味着两个信号之间的功能连接的存在并不代表着存在真正的神经元交互,而是表明存在来自两个通道的同一潜在源的活动。至少在与神经科学相关的频率范围内,容积传导和磁场扩散的一个重要特征是,它的效果是瞬时的。也就是说,如果一个主要的节律性神经元源在两个传感器上同时可见,那么在这些传感器上观察到的相位是相同的(或者当每个传感器看到偶极子的另一端时,相差180)。可以利用这种即时性的特征来使用连接性指标,从而丢弃0(或180)度相位差的贡献。这将在下面进行更详细的解释。

当考虑到不同的电生理记录技术时,在侵入性记录中场扩散的问题是最小的。根据定义,单个神经元的尖峰活动在空间上非常集中,与这种尖峰相关的体积电流只能在几十或数百微米的距离被捕捉到。因此,对于尖峰-尖峰或尖峰-场交互作用的量化,场的传播几乎不是一个问题。在对两个LFP信号进行同步估计的解释时,需要考虑容积传导。原因是局部场势可能反映容积电流在更大距离上传播,超过1 cm。截止目前,在进行非侵入性测量时,由于传感器与神经源之间的距离较大,并且由于颅骨对EEG头皮上电势分布的空间模糊效应。因此,单个潜在的神经元源会出现在多个EEG或MEG传感器上,导致传感器之间的虚假相干。

在存在场扩散的情况下,任何给定的源同时在多个传感器/电极上是“可见的”,并且可以采用几种策略来减轻场扩散的不利影响。第一种策略试图对测量信号进行“去混合”(unmix),以得出对潜在源的估计。在EEG/MEG记录的背景下,人们应该考虑源重建算法的应用;在LFP记录的背景下,人们应该考虑重参考方案的应用,例如使用局部双极推导,或估计电流源密度。第二个策略是使用控制良好的实验对比。这里的假设是,在这两种情况下,容积传导以类似的方式影响连接性估计,减法将有效地消除虚假估计。第三种策略是使用利用异相交互的连接性指标,丢弃相位差为0(或180°)的交互。这些指标的例子是相干的虚部、(加权的)相位滞后指数或相位斜率指数。以不能检测在接近零相位差时发生的真实交互为代价,这些指标至少提供了信号分量之间真实(相位滞后)交互的说明。不幸的是,无论是应用源重建技术(这还增加了数据分析的复杂性),还是使用实验对比或相位滞后交互作用方法,都不能完全减轻容积传导的影响。这在其他地方有更详细的描述。

sim_volumeconduction.pdf脚本演示了上面提到的一些问题,以及克服这些问题的部分方法。这组模拟是在50个“测量通道” (MEG/EEG通道,或虚拟电极)模拟一组信号。每一个信号都是由潜在源活动的混合(由于场扩散)组成的。源活动时间过程是通过生成自回归模型产生的。源-信号混合矩阵定义为原始源激活与 31 点汉宁窗口的空间卷积。换句话说,我们可以把信号看作是由原始信号源和两边最接近的15个信号源的加权组合,空间泄漏取决于距离。

 

图6:场扩散对连接性估计的影响(A)在缺乏连接性的情况下,场扩散导致虚假的相干 (左图),而相干的虚部减轻了这种影响(右图)。(B) 在存在时滞交互作用的情况下,由场扩散引起的“seed blur”仅导致相干中的“shoulder”,而不会导致远处的峰值(右上图)。相干的虚部正确地识别了远处的峰(右中)。底部面板:当在连接(黑线)和未连接(红线)的情况之间比较差异(蓝线)时,远处的相干峰被显示出来。(C) 当信噪比从一种情况变化到另一种情况时,虚假微分效应既出现在相干 (上图)中,也出现在相干的虚部(下图)中。(D) 当一个有活动源的振幅从一种情况变化到另一种情况时,虚假微分效应在相干 (上图)和相干的虚部(下图)中均有体现。

图6A显示了所有传感器对的连接性矩阵,源信号的构造使得所有潜在的源都没有交互作用(即自回归模型系数中没有交叉项)。噪声协方差矩阵在对角线上只有非零值,其中第16和35个源的值较大。左边的面板显示相干,说明了种子模糊作为场扩散的结果。矩阵中的每一行(列)反映了与特定种子传感器(由行号索引)相关的相干性。靠近对角线的点是受泄漏影响最大的位置。可以看出,种子模糊是相当大的,即使信号是低的(在两个活动点外用白色圆圈表示)。此外,在信号存在时(即从活动位置播种时),种子模糊在空间上更广泛。右边的面板显示了相干的虚部,并表明(1)在没有时滞交互作用的情况下,这个量很低;(2)种子模糊被消除。图6B显示了一个模拟,其中第16和第35个源实际上是在一个非零时滞的情况下连接的。左边的面板显示相干矩阵,相干虚部,和左上角子面板b和a的区别。右边的面板显示在这些矩阵的行(虚线左边白线)的连接,反映了16源的种子连接性。图6B右下角的子面板用黑色表示图6B左上子面板的相干性,用红色表示左上子面板的相干性,用蓝色表示它们之间的差异。到目前为止,这些模拟在一个非常简化的场景中演示了磁场扩散的影响,以及通过减去两个活动源间不同连接性水平的条件,或通过关注连接性的时滞成分提供的补救效果。

然而,真实的实验数据很难像上面的模拟数据表现得那样好。以下提供了一些例子,在这些例子中使用补救策略可能产生被错误解释的结果。图6C显示了在第16个和第35个信号源之间存在一个真正的连接的情况,它的强度在不同的条件下不会发生变化。在其中一种情况下,一个额外的源是活动的(在位置27),它没有连接到任何其他源。然而,差异图显示了相当大的空间结构,这是由于场扩散对连接性估计的不同影响。例如,使用相干性作为连接指标从第11个源进行播种,会在第25个源附近产生虚假的非零差异。如图6C的右侧面板所示,其中红色和黑色线显示了基于单个条件种子的连接性估计,它们之间的差异用蓝色线显示。同样地,使用相干虚部从第22个源进行播种,会在第28个源附近产生虚假的非零差。这意味着贡献源活动的差异可能导致连接性估计的虚假差异。有人可能会说,适当的种子选择可以防止这种错误的解释。如果我们一开始就把重点放在活动源上,问题可能就不会那么严重。但在实践中往往很难选择合适的种子,例如,因为相关的来源不一定代表着最高的振幅,即使恰当选择了种子通道,还是可能会出现虚假的连接。

如图6D所示,对比了两种情况,活动源(16和35)之间的连接性不变,但其中一个源的功率发生了变化。右边的面板显示了活动源35的低(红线)和高(黑线)功率条件下的种子连接(来自活动源16),以及它们的差异(蓝线)。

解释由场扩散引起的连接性估计的困难,对于正确推断有向连接性也是有困难的,例如通过格兰杰因果关系或相关指标来解释。因此,这些源信号与其他场传播的接近混合会导致通道之间的信噪比差异,以及频谱传递矩阵和噪声协方差估计的不准确性。虽然一些模拟工作表明,真正的潜在网络连接性可以通过应用重新标准化版本的PDC来恢复,但Vinck等人 (2015)表明,瞬时混合对于格兰杰因果关系的准确重建是有问题的。这些作者建议使用一种启发式方法来研究信号之间的瞬时交互与它们的延时交互之间的关系,以便丢弃或接受有向连接性的估计,使其具有可信赖性。

信噪比问题

图片

图7 :信噪比问题的模拟。(A) 两个节点在两个方向上以相等的连接强度双向交互,并且在没有(case1)或有(case2)测量噪声的情况下观察数据。(B)case1的能量。(C)case1和case2的相干。(D)case1的格兰杰因果关系估计。(E)能量。(F)case2的格兰杰因果关系估计。(G) 对case2产生的数据进行时间反转后的格兰杰因果关系估计。

另一个导致估计连接性的解释问题的就是我们所说的信噪比问题。在某种程度上,这个问题与上面讨论的场扩散问题有关,因为它的本质是测量信号包含了一个知之甚少的感兴趣的信号和噪声的混合。上文已经在一定程度上说明了信噪比问题的一些后果,这是由于不同条件的信噪比不同,那么不同条件之间的比较会导致虚假的连接性差异。除了在正确推断不同条件下连接性的差异存在问题外,信噪比的差异在推断源之间的有向交互作用的差异时也存在问题。值得注意的是,在没有容积传导的情况下也会出现这个问题(例如,当从局部参考LFP记录计算连接性时),因此我们认为这个问题值得单独讨论。这里的核心问题是,虚假方向连接性估计可以从两个信号中获得,每个信号都可观察到不同数量的信号和噪声。例如,当在LFP记录点之间存在传感器噪声的差异(例如,由于放大器特性的差异),或与感兴趣的活动源存在距离的差异,导致信号强度的差异时,就会出现这种情况。虽然这对于许多有向连接性指标来说都是一个问题,但在本节中,我们将特别关注信号之间的信噪比差异如何影响格兰杰因果关系的估计。我们通过一些模拟来说明这个问题,这些模拟可以通过运行脚sim_signaltonoise.pdf中的代码来实现。

为了理解为什么信噪比的差异可能会对格兰杰因果关系的估计造成问题,记住如果一个时间序列的过去可以增强对另一个时间序列的预测,那么一个变量对另一个变量具有格兰杰因果影响是有用的。一般来说,这种方法可以检测到真正的连接性,然而,当应用到噪声数据时,这种基于预测的因果关系的定义可能会导致意想不到的结果。想象一个情况如图7所示:变量x1和x2是由一个自回归过程产生的,它是时间滞后1和2时它们自身过去的函数(自项),也是时间滞后1和2时另一个变量(交叉项)自身过去的函数。关键是,自项和交叉项的自回归系数相同,两种过程的创新方差(ε1,ε2)也相同,这意味着两个变量相互影响的强度相同。因此,通过构造,x1到x2的格兰杰因果关系与x2到x1的格兰杰因果关系应该是相同的。当这种生成过程的输出在没有测量噪声的情况下被观察时,这确实是一种情况,如图7B-D所示。在这种情况下,如预期,两个变量有几乎相同的在40Hz达到峰值的功率谱(图7B),其相干谱也在40Hz处达到峰值(图7C),并且在40Hz处的两个方向上具有近似相等的格兰杰因果关系(图7D)。注意,从x1到x2与x2到x1之间的格兰杰因果关系的细微差异是由于估计误差,随着模型实现的次数和后续观察的重复,估计误差接近于零。

现在让我们考虑情况2,我们观察相同的系统,但这个存在噪声测量。在这种情况下,白噪声被加到x1,而不是x2。这种操作的第一个结果是x1的功率谱向上移动(图7E),这是将该通道中所有频率(即白噪声)的功率相加的结果。如图7C所示,通道之间的相干性也通过这种操作进行调节,当存在额外的噪声时,在一个宽广的频率范围内相干性降低。当观察格兰杰因果估计时,如图7F所示,文章来源于微信公众号(茗

科技),欢迎有兴趣的朋友搜索关注。我们观察到一种不对称关系,其中x2对x1的格兰杰因果影响大于x1对x2的影响。这是由于x1上的额外噪声削弱了x2的预测能力,造成了方向性的明显不对称。请注意,这种不对称完全符合基于预测误差的对数比(将单变量模型与双变量模型进行比较)的格兰杰因果关系的定义,从这个意义上说,它是正确的。然而,这确实导致了“格兰杰因果关系”和我们作为实验主义者想推断的“真正因果关系”之间的分歧,在这里我们想从格兰杰因果不对称估计中推断出信息流的主导方向。

这些模拟描述了最坏的情况,当通道之间存在巨大的信噪比差异时(x1的信噪比为1,x2的信噪比最大,因为没有添加噪声)。Haufe等人将由信噪比差异驱动的格兰杰因果关系中的不对称定义为弱不对称,而不是由真实的时间滞后和因果关系引起的强不对称。为了能够在解释估计的格兰杰因果关系时区分弱不对称和强不对称,Haufe等人建议在信号时间反转后研究格兰杰因果关系。其基本原理是,只有在强不对称存在的情况下,时间反转才会导致交互作用的主导方向发生翻转,这是因为时间反转操作不影响单个信号的信噪比(单变量AR模型中自项的AR系数在时间正向和相后方向上相同,因此功率谱和“自预测”对时间反转不敏感),因此,如果这些是由弱不对称引起的,则不会影响有向交互作用的差异。根据我们之前模拟的数据计算出的时间反转格兰杰因果关系如图7G所示。显然,时间反转揭示了占主导地位的格兰杰因果方向(x2到x1)没有变化,表现为弱不对称。另一方面,当格兰杰因果关系的方向差异背后存在着实际的强不对称时,时间反转检验将导致因果流在时间反转方向上的变化。在图8所示的模拟中,产生了强烈的不对称性,即从x2到x1的单向流动,导致了在恰当方向上的不对称格兰杰因果关系(图8D)。当信号时间反转时,格兰杰因果关系的方向性也发生反转(图8E)。因此,在实际应用中,对于仅由信噪比差异引起的格兰杰因果关系的虚假方向差异,原则上可以采用反向格兰杰检验进行诊断,这在存在线性混合的情况下,也大大降低了检测虚假格兰杰因果关系的假阳性率。

当然,只要有可能,信噪比问题可以在实验层面上加以解决,在实验层面上应尽量减少噪声,并确保通道上的信噪比尽可能均衡。例如,在EEG或侵入性LFP记录中,可以让阻抗在数据记录之前尽可能地相等,传感器应该放置在合适的位置使信噪比最大化。然而,在实践中,这些并不总是可能的,例如在非侵入性记录(场传播),或由于潜在来源的活动的内在差异的情形下。在这种情况下,可以采用分层技术,通过试次子采样,在不同条件下使信号功率的分布特征尽可能相似。另外,也有人建议使用分析方法对事后测量噪声进行校正。例如,一些作者提出了利用状态空间建模分离记录信号中的信号和噪声成分的算法。这种方法假设观察到的时间序列表示感兴趣的信号(建模为自回归模型)和一些叠加噪声的组合,并旨在分离这两个量。在不相关的高斯噪声的模拟中,这种方法在很大程度上纠正了这个问题,产生了不受噪声污染的格兰杰因果关系估计。另一种方法是使用动态因果模型(Dynamic Causal Models, DCM),其中生成模型是一个实际的生物物理上可信的神经元模型,而不是时间序列的自回归描述。在DCM框架内,有可能区分潜在生物物理过程的动力学(潜在神经元群的激活和相互作用)和这些过程的测量。因此,可以同时考虑相关和不相关的观测噪声,从而使连接性估计对信噪比的变化具有更加稳健。

图片

图8:时间反转格兰杰检验揭示了强不对称的存在。(A) 一种指定单向系统的自回归模型,x2在滞后1和2上影响x1。(B)能量。(C)相干。(D)对未来时间方向的格兰杰因果关系估计。(E)反向时间方向的格兰杰因果关系估计。请注意,功率和相干在从正向或反向时间方向的数据估计中保持不变。

常见的输入问题

图片

图9:常见输入问题的模拟。(A)一种模型的自回归模式,模拟x3到x2、x1的公共输入。(B)由公共输入引起的x1和x2之间的虚假相干。虚假相干(绿色)和部分相干(紫色)接近于零,表明是瞬时的和中介的(通过x3)交互作用。(C)格兰杰因果估计检测到的公共输入不同于x1和x2之间的直接交互作用(接近0)。(D-F)当来自x3的时滞公共输入存在且仅观察到x1和x2时,数据就会表现出时滞交互作用。这种情况只能通过记录了公共驱动来正确解释。(G,H)应用部分相干。(H)或多元格兰杰因果关系(I)。

从测量数据中推断估计的交互作用的另一个问题是难以区分直接和间接的交互作用。换句话说,如果检测到一对信号之间的功能交互,这可能是由来自第三个源的公共输入引起的,而第三个源没有被考虑在内。如图9A所示的生成模型。我们使用生成自回归模型来模拟三个源(x1、x2和x3)之间的连接结构,其中x1和x2不是直接连接的,而是从滞后1处、滞后2处接收x3的公共输入。作为公共输入的结果,信号x1和x2之间将存在共享的方差。图9B显示了case1的相干光谱。请注意x1和x2之间的相干谱在40Hz时的清晰峰值(蓝色线)。如果我们将这种相干谱解释为神经元直接交互作用的证据,这将是一个虚假的推断。因此,为了帮助解释相干谱,我们需要明确地考虑共享方差导致观测到的相干是否来自公共输入。如果我们观察所有三个节点,这可以通过在分离了x3的贡献之后,考虑x1和x2之间的相干性来完成(图9B中的洋红色线),它报告了x1和x2之间的显著减少的相干值,表明是由于公共输入而共享的方差(相干)导致。从另一个指标看,在这种情况下是相干(绿色线)的虚部,也接近于零,表明x1和x2之间的共享方差可以完全由零滞后分量来解释,正如场扩散所期望的那样,或者在本例中,由同时到达且在x1和x2具有相同滞后的公共输入来解释。

我们还可以通过计算格兰杰因果关系来检验x1和x2之间的共享方差是由于它们的直接交互作用还是公共输入的影响所致。图9C显示了基于光谱密度矩阵多元分解的x1、x2和x3之间的格兰杰因果关系估计,即观察所有三个节点。通过使用格兰杰因果关系将无向连接性分解成有向连接性,只有具有真正潜在耦合的连接(连接x3 →x1和x3→ x2)才能存活,而虚假连接(x1 →x2和x2→ x1)会被抑制,因为它们的瞬时交互作用吸收了共享方差,而瞬时交互作用不是因果(滞后)交互作用的一部分。在这种情况下,条件格兰杰因果关系或部分格兰杰因果关系将有助于判断x1、x2和x3之间真正的潜在连接性。这些模拟可以通过运行脚本sim_commoninput.pdf中的代码来实现。 

请注意,我们已经假设公共输入具有相同的耦合强度,同时具有相同的时间延迟,并且在相同的信噪比下进行记录。在真实数据中,随着这些假设逐渐被违背,格兰杰因果关系的估计也将开始反映虚假的方向耦合。这是因为任何参数的变化都会影响一个节点的方差预测其他节点方差的能力,从而改变格兰杰因果关系值,如信噪比一节所示。如果没有从提供公共输入的节点进行记录,这可能会特别成问题。图9D中,x3通过影响滞后1处的x1和滞后2处的x2来提供时间滞后公共输入。图9E和图9F显示了仅观察到x1和x2后计算的相干性和格兰杰因果关系。图9G中x1→ x2影响优于x2 →x1影响,在这个特定的例子中,正确推断真实连接性结构的唯一方法是观察所有三个节点,并执行多元格兰杰因果关系。图9H显示,所有三个节点之间都存在很强的相干,尽管x1和x2之间的相干是公共输入的结果。这也可以通过执行部分相干(图9H中洋红色线)来检测,该部分相干消除了x3对x1和x2之间相干性的线性贡献(使其接近于零)。此外,多元格兰杰因果关系(图9I)正确地分解了真实的因果结构。

对于具有三个以上节点的网络,在推断真正的网络因果关系方面已经取得了一些进展,即使存在未被观察到的时滞公共输入。特别是,Elsegai及其同事开发了一种基于重构PDC和子网络分析的技术,尽管该方法只能在可能的交互作用子集中解决正确的连接性。因此,公共输入仍然会导致虚假的推断,目前唯一能保证克服这个问题的方法是直接测量可能提供公共输入的节点。

样本大小偏差问题

当在两个或多个条件之间比较连接性指标时,其中用于计算连接性的观察数在条件之间是不同的,样本大小偏差可能是一个问题。一般来说,连接性的指标(除了少数例外,如PPC)通常是有偏差的量,在没有连接性的零假设下,估计值将偏离零。其中一个原因是,许多指标反映了一个矢量的大小,它总是有一个正值,这只是说明期望值永远不会为零的另一种方式(除非在图3C这样的高度人为的场景中)。偏差的大小通常取决于样本量:样本量越小,偏差越大。其结果是,在比较不同观测次数的样本的连接性指标估计值时,在样本容量最小的情况下,可能会有高估连接性的倾向。此外,更重要的是,即使没有真正的交互,也可能发现和报告非零差异。

为了使用非参数频谱估计技术获得相位同步的估计,一个必要的步骤是进行矢量求和运算,然后通过总的试次数对其进行标准化。当使用较少的试次来估计相位一致性时,即使在没有相位同步的情况下,与使用较多试次时相比,这些矢量可以更容易地在同一个方向上对齐(从而求和为一个非零相干值)。这种偏差如图10A所示(源自脚本sim_samplesizebias.pdf),在基于5、10、50、100和500试次数计算相干后,实现了对简单自回归模型的100次模拟。基于较低的试次数估计相干性会得到一个平均相干值,与较高的试次数相比,该值显著更高,并且在不同的估计中也更具可变性。图10B显示了相同的模拟,但使用格兰杰因果关系作为连接性指标。这表明,当使用非参数技术进行估计时,相干性、PLV和格兰杰因果关系等指标存在正偏差的,在进行适当的推断时,应该考虑到这一事实。要估计给定估计中存在多少偏差,可以通过重新排列数据段和破坏通道之间的时间对齐来创建参考分布。这将保持每个信号的功率谱,但应该使交叉谱的交叉项接近零。在重复时间重组和连接性估计的过程后,我们可以将经验观察到的连接性估计与参考分布进行比较,并确定一个适当的显著性水平。为了估计连接指标的绝对值,比如格兰杰因果关系,可以减去估计偏差,得到一个去偏估计。注意,这种方法只能成功地消除与连接性估计相关的样本大小偏差。其他增加连接性估计值的现象,如场扩散,在试次变换程序中没有得到适当考虑,必须通过其他方式加以处理。

图片

图10:相干和格兰杰因果关系估计的样本量偏差。(A-C)对于每个相应的指标,运行基于5、10、50、100和500次试次的模拟,和相干(A),格兰杰因果关系(B),和PPC(C)计算结果。每个面板反映了100次模拟的±1个标准偏差的平均值。

可以采用几种方法来考虑样本量偏差。在一些实验情况下,每个条件的观察数量或多或少是通过设计来平衡的(但在实践中是不同的,例如,在伪迹去除后),一种策略是让不同条件下的试次数相等,通过随机删除试次数较高的条件下的观察值,直到试次数相等为止。这种方法是理想化的嵌入bootstrap程序,其中随机删除重复多次的试次,以获得更稳健的估计。此外,对于某些指标(例如相干),可以计算和应用偏差的分析估计。对于相干而言,这通常与稳定方差的z转换相伴而行,它有助于进行有意义的组统计推断的额外优势。另一种可能是使用非参数统计检验来解释推论统计框架内的不同样本大小偏差。或者,在相干性的特定情况下,可以考虑分布性质,并使用Jackknife程序进行参数统计推断。或者,我们可以使用一个固有的无偏的指标来检测同步,例如PPC(见图10C)。最后,还可以估计与任何特定功能连接性指标相关的偏差(例如,通过将一个通道的试次序列相对于其他通道进行排序,并计算功能连接性指标),然后从经验观察的连接性值中减去这个偏差估计。

结论

在这篇文章中,我们对目前用于量化节律性功能连接的不同方法进行了非详尽的综述。我们描述了一种分类法,以强调这些方法如何相互关联。对于一些最常用的指标,我们也描述了它们背后的直观理解和一些数学公式。这意味着揭开这些连接性指标所反映的数据特征的神秘面纱,以及它们是如何计算的。接下来,我们提出了一些重要的问题,这些问题可能会干扰对电生理记录的连接性估计的正确解释。对这些问题的描述伴随着一系列简单的模拟。

我们希望这些模拟给读者留下深刻的印象,naïve应用连接性分析来观察电生理时间序列数据,可能会导致无数虚假的推论。在这份手稿中提出的模拟旨在说明一些最常见的情况,在这些情况下,实验科学家将面临解释困难。这些问题包括与使用公共参考相关的问题、容积传导/场扩散的存在、信噪比的差异、观察到的或未观察到的公共输入,以及与样本大小差异相关的偏差。此外,通过使用MATLAB脚本用于执行模拟,我们希望能鼓励读者运行这些模拟,并且他们不会回避更改脚本中的参数以更详细地探索这些潜在的解释混淆的后果。此外,这些脚本还可以用作一个受控制的环境,在此环境中可以开发和探索针对这些混淆的不同解决方案,然后再将它们应用于实际数据。

我们阐述了我们探索的有关解释陷阱的潜在解决方案。对于常见的参考问题,我们讨论了通过双极推导或电流源密度估计的局部参考如何有效地去除常见的信号分量。另一种可能的方法是使用一个指标,明确地抛弃交互的零滞后分量。接下来,我们讨论了如何用三种不同的方法来处理容积传导/场扩散问题:通过源重构或局部参考,通过使用实验对比(这使容积传导效应在各种条件之间不变的假设有时是无效的),或通过使用对容积传导不敏感的方法,如相干虚部。磁场扩散也影响有向功能连接性的估计。目前还没有一种方法可以保证在这种情况下去除容积传导效应的影响。防止假阳性推论的一种方法是调查瞬时交互作用,以确定场扩散效应是否太大而无法进行分析。原则上,另一种可能性是将容积传导纳入格兰杰因果关系的估计框架,这需要进一步发展基于模型的连接性估计方法。

针对使用有向连接估计(特别是格兰杰因果关系)对交互作用的主导方向可能产生的误解,讨论了不同通道间的信噪比问题。我们演示了一个基于时间反转格兰杰因果关系的检验,以确定格兰杰因果不对称是来源于数据中的强不对称还是弱不对称。此外,我们指出了基于状态空间建模和DCM的新方法,明确考虑了信号和噪声对估计连接性的单独贡献。

还讨论了公共输入的问题,当研究人员想要就两个神经元组之间的交互作用是直接的还是由第三个来源介导的问题做出说明时,这一点尤其重要。一般来说,如果功能连接网络的所有节点都没有被采样,就不可能区分直接和间接的交互作用。这不是一个理论问题。例如,越来越多的证据表明,一些皮质-皮层的相互作用是由丘脑介导的。通过对丘脑和两个皮层区域(V4和TEO)的LFP记录,Saalmann和同事发现,在丘脑驱动条件作用后,V4和TEO之间的皮质-皮层相干几乎完全消除。公共输入的问题在理论上可以通过实际记录可能提供公共输入的节点,并通过计算多元分解和条件格兰杰因果关系或部分相干来解决。在实践中,由于实验设置的限制,这个解决方案可能并不总是可行的。然而,在过去的几年里,在扩展神经科学方法的覆盖面方面取得了很大的进展。例如,利用钙成像技术,现在可以在新生斑马鱼中实现单细胞分辨率和接近全脑采样。此外,在这两种动物以及接受神经外科治疗的人类患者中,允许显著的脑覆盖和密集的LFP空间采样和尖峰活动的方法现在变得越来越可用。

最后,我们讨论了样本容量偏差对连接性估计的影响。这个问题可以通过使条件或被试之间的样本量相等,使用明确考虑样本量偏差的统计方法,或使用不受样本量偏差影响的连接性方法(PPC或去偏方法)来解决。

这些模拟是使用Fieldtrip工具箱实现的。我们注意到,其他工具箱也可用来估计功能连接数据,最明显的是EEGLAB和SIFT工具箱,MVGC工具箱, Hermes工具箱,用于转移熵计算的TRENTOOL工具箱,以及Chronux工具箱。这些工具中的许多都是开源的,并且受益于广泛的用户和贡献者社区,这有助于改进这些工具并促进更大规模的使用。

最后,我们强调,我们注意到的困难并不排除对电生理数据连接性进行有意义的分析,即使存在这些问题。需要简要提及的一个相关方面是,在将连接性估计技术应用于神经科学数据和正确解释结果方面,适当使用推断统计程序是至关重要的一步。统计检验用于建立连接的显著性(相对于无显著耦合的无效假设),以及建立条件之间耦合的显著变化(相对于无显著变化的无效假设)。这通常是在非参数统计测试框架内完成的和/或使用bootstrap抽样和试次重组(见Bastos et al,2015b的方法部分)。然而,使用不当的统计过程仍可能导致对结果的过度解释(例如,在实际是人为的情况下推断出显著的相干性,或在不同条件下的信噪比存在差异时推断出交互作用的差异)。我们希望对这篇综述中所描述的解释问题的明确讨论能提高更广泛的神经科学界的认识。与此同时,正在不断发展新的方法来解决这些问题。总的来说,随着更好的数据、更细致的假设和实验以及改进的分析工具不断为大脑的动态连接提供新的见解,我们可以对未来持乐观态度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值