焦虑相关症状与错误相关大脑活动的机器学习研究

摘要

焦虑症状可能会影响大脑对错误的加工方式。然而,许多研究报告的结果相互矛盾且不可再现,因此大脑对错误的反应(即错误相关负波[ERN];错误相关正波[Pe])与特定焦虑症状的对应关系仍不清楚。本研究收集了171名被试的16个焦虑维度自述评分,并采集了他们的EEG信号。然后,使用机器学习(1)识别与ERN/Pe增大有关的主要症状;(2)评估传统统计方法的泛化能力。本研究结果表明,ERN的振幅以及其他大脑信号变化编码了与个体错误加工相关的信息。泛化性检查结果表明,改变结果验证方法可以获得反映个体差异和临床有用生物标志物的稳健信息。

引言

认知和情感神经科学研究的主要目标是建立大脑结构与脑-行为活动之间的关系。尽管这种脑-行为关联是大多数认知神经生理学研究的重点,但研究报告的结果缺乏一致性。标准统计分析通常包括检验组间或条件间的差异,结果常以均值、标准差和置信区间来描述。但基于这种组水平进行推断可能会导致误导性结论。

正如Rouder及其同事(2021)所报告的那样,只有当群体中的所有个体都表现出相同方向的效应时,从均值进行推断才有意义。在这种情况下,效应既可以解释,也可以表示为感兴趣变量的函数;然后可以使用相同的函数来预测所有个体的效应。当群体中的个体表现出相反方向的效应或部分群体显示无效应时,情况就变得更加复杂了。这种复杂的个体差异表明,被解释的现象比从群体研究中看到的更为复杂,因此通过群体比较或简单的线性回归来分析和预测这种现象可能会产生误导性的结果。

为了解决实证研究中常用的统计方法的局限性,神经科学和实验心理学开始高度关注机器学习(ML)方法。ML技术可以提高结果的泛化性和稳健性。本研究旨在使用机器学习框架来预测人类大脑活动中与焦虑相关的症状。在这里,本研究重点关注焦虑的不同维度以及与错误相关的大脑反应。

方法

参与者

共171名健康被试(120名女性和51名男性)参加了这项研究,年龄在18-40岁之间(M=22.75岁,SD=3.60)。无药物、神经或精神疾病史,并且视力正常或已矫正至正常水平。被试的平均教育年限为15.16年(SD=2.56)。在分析之前,有8名被试因EEG数据总体质量较差而被排除。因为在小样本数据中进行机器学习分析需要高质量的数据。为确保EEG数据的质量,任何包含伪迹的数据段都被剔除。因此,有33名被试的数据因无伪迹试次段数量少于5个而被排除。最终样本包括130名被试(93名女性和37名男性)的EEG数据,这些被试的年龄在18-40岁之间(M=22.88岁,SD=3.76),平均教育年限为15.08年(SD=2.49)。

程序和任务

记录被试在执行一项快速的颜色+方向go/no-go判别任务时的EEG信号,该任务在之前的几项研究中得到了验证。该任务的实验范式如图1所示。完成任务后,让被试填写一系列自我报告问卷。所有被试签署了书面知情同意书,并获得了相应报酬。本研究遵循《赫尔辛基宣言》中的伦理原则,并获得了波兰雅盖隆大学哲学院研究伦理委员会的批准。

图1.go/no-go范式及其条件:(A)Go试次;(B)正确反应的no-go试次;(C)不正确的no-go试次,即错误反应。

测量量表

从被试填写的量表中选择以下维度进行焦虑相关现象的分析:反刍思维量表,反刍量表(RRQ);状态-特质焦虑量表,特质量表(STAI);抑郁-焦虑-压力量表-21,焦虑量表(DASS-21);行为抑制系统(BIS)量表;强迫症症状分类量表-修订版,检查、囤积、强迫观念、排序、神经中和与清洗量表(OCI-R);强迫信念量表-20,威胁高估量表;白熊抑制量表(WBSI);不确定性低容忍度量表-12,抑制性和前瞻性量表;罗森伯格自尊量表(SES)。所有评分均按照量表原作者提供的说明进行计算。

电生理记录和数据预处理

该实验由训练有素的研究人员在一间隔音室内进行。使用BioSemi Active-Two系统,以256Hz的频率连续记录64个Ag/AgCl活性电极(带有前置放大器)的EEG信号,共模感应电极(CMS)和驱动右腿电极(DRL)分别作为在线参考电极和接地电极。在左眼上方和下方,以及双眼外眦放置四个额外的电极来监测水平和垂直眼电(EOGs)。使用BrainVision软件(Brain Products GmbH)对脑电信号进行预处理。使用双侧乳突进行离线参考。首先采用Butterworth四阶高通滤波器(截止频率为0.05Hz)和二阶低通滤波器(截止频率为128Hz)进行滤波。使用50Hz的陷波滤波器去除电源线噪声。将数据进一步分割为以反应锁时的时段(-100ms~600ms)。使用Gratton、Coles和Donchin的算法进行眼动伪迹校正。伪迹拒绝标准为振幅超过±65μV阈值的试次,并对每个时段进行基线校正(前100ms)。

特征提取

在进行进一步分析之前,将数据集按3:7的比例划分为测试集和训练集。在每个数据集中,那些响应错误的无伪迹时段少于五个的受试者被排除,结果形成了一个包含34名参与者的测试(外部)数据集,以及一个包含96名参与者的训练(内部)数据集。在训练集中,每位参与者平均包含用于分析的无伪迹错误响应时段为17.03个(SD=10.80);在测试集中,为17.85个(SD=8.81)。

为了将数据的空间变异性限制在假设的感兴趣信号上,本研究选择了不同的通道子集,即ROIs(感兴趣区域)。由于这是一个数据驱动的探索性机器学习框架,本研究决定测试两个ROIs,以检查空间变异性对结果的影响。基于初步的内部一致性分析定义了七个ROIs,包括额叶、中央和顶叶通道,这些通道可能包含与错误处理相关的信号。然后,分别为Pe和ERN选择了两个ROIs,这些ROIs具有最大的平均内部一致性得分或最佳的内部一致性分布。ERN选择的ROIs如下:(ROI 1)Fpz、AFz、Fz、FCz、Cz、CPz、P1、Pz、P2;(ROI 2)Fpz、AFz、F1、Fz、F2、FCz、C1、Cz、C2、CPz、P1、Pz、P2。Pe选择的ROIs如下:(ROI 3)Fpz、AFz、Fz、FCz、C1、Cz、C2、CPz、P1、Pz、P2;(ROI 4)Fpz、AFz、F1、Fz、F2、FC1、FCz、FC2、C1、Cz、C2、CP1、CPz、CP2、P1、Pz、P2。

此外,使用40Hz的Butterworth六阶滤波器对信号进行滤波,并在每个参与者的试次中进行平均。为了提取大脑信号的空间特征,使用主成分分析(PCA)对错误响应试次进行处理。PCA成分的数量(1-4个)被视为模型的超参数,并在模型的超参数调优步骤中自动选择。本文决定将PCA成分的最大数量限制为4个,这是在过拟合、可解释性以及信息保留量之间进行权衡的结果。由于包含大量超参数的复杂模型很容易出现过拟合,因此在测试数据上的性能不佳;同时,前四个成分解释了信号中的大部分方差。每个空间成分的ERN分数和Pe分数分别以峰-峰幅值进行量化。在进行峰-峰测量之前,数据在47ms的bin上进行平均,以减少高频背景EEG噪声可能造成的干扰或失真。图2显示了详细的ERN/Pe分数提取流程。

图2.特征提取管道。

本研究还对ERN和Pe进行了经典的ERP分析。在ERP分析中,ERN量化为Fz电极在0-100ms时间窗内的平均振幅。Pe量化为Cz电极在150-350ms时间窗内的平均振幅。目标ERP成分的时间窗是基于本研究先前使用类似的实验范式进行反应抑制的研究选择的。采用线性回归进行ERP分析。

内部一致性

为了提高结果的可重复性和可比较性,本研究计算了被试内和被试间的变异性,以及特征的内部一致性。被试内和被试间变异性分别计算为被试内和被试间试次得分的标准差。内部一致性计算为被试水平的可靠性系数,如公式1所示:

其中,

为被试间方差,

为特定个体内的方差,nijk为第k组中个体j的试次i的数量。

回归模型

由于量表之间存在相关性,因此对每种焦虑相关现象进行了单独的回归分析。基于ERN或Pe的PCA得分作为自变量,量表得分作为因变量。选择以下回归模型进行分析:(1)弹性网络模型(ElasticNet)和(2)具有径向基函数核(KR-rbf)的核岭回归模型。弹性网络模型的两个超参数(λ和α)的范围分别由1e-7到1e3和1e-8到1的20个对数间隔值构成。KR-rbf将L2范数正则化的线性回归与核技巧相结合,使用系数的线性组合来捕捉非线性关系。L2范数正则化的强度(α)是模型的超参数,其取值范围包括20个对数间隔值,从1e-5到1e3。

验证策略

本研究使用三折交叉验证来确定模型的超参数,这是在训练集大小和训练持续时间之间的权衡。采用决定系数R2分数对模型进行评估。一旦确定了在任务中表现最佳的估计器及其最佳超参数,就会进行额外的验证。这种额外的验证包括:(1)使用R2分数评估模型在测试数据集上的性能;以及(2)评估其结果的统计显著性。测试数据集包含量表得分和EEG数据;需要注意的是,在模型训练过程中并未使用测试数据集。验证过程中的模型使用了与训练时相同的处理方法,因为特征提取步骤是模型的一部分。通过置换检验评估结果的统计显著性,置换次数为(n=10000)。本研究未进行多重比较校正,因为研究中将每个量表-ERN/Pe模型视为单独的假设。模型的训练和验证流程如图3所示。

图3.模型训练和验证管道。

使用 MNE-Python、Pandas、Scikit-learn和NumPy Python软件包进行分析。

结果

行为结果

在训练集中,被试的平均错误响应次数为29.75次(SD=16.19),正确响应次数为221.38次(SD=7.14);在测试集中,平均错误响应次数和正确响应次数分别为31.88次(SD=17.08)和222.18次(SD=2.97)。在训练集中,错误响应的平均反应时(RT)为282ms(SD=43ms),正确响应RT为329ms(SD=39ms)。正如预期的那样,被试在错误试次中的反应速度显著快于正确试次(p<.001)。在测试集中,错误响应的平均RT为295ms(SD=62ms),正确响应为334ms(SD=43ms)。同样,相对于正确试次,被试在错误试次中的反应速度明显更快(p<.001)。表1显示了训练数据集中量表数据的描述统计量和相关性。

表1.训练数据集中量表的描述性统计和相关性。

EEG特征

为了提高信噪比并区分ERP特征,本研究对分段信号应用了主成分分析(PCA)。ERN和Pe的成分权重和振幅如图4所示。

图4.提取的PCA成分的总平均值及其相应的空间模式。

在本研究的分析中,第一个PCA成分的方差解释性最大,对应于ROI中包含的EEG信号的平均值。因此,第一个PCA成分很可能是错误监测过程强度的标志。本研究假设这个成分的非零系数反映了与错误监测强度相关的个体差异。第二、第三和第四个成分评估了与错误相关大脑信号的空间分布:对于每个成分,假设一个非零系数对应于预期的ERN/Pe空间位置和分布,即与图4所示的模式高度相似。由于存在右半球偏侧化,第四个成分可以被视为与错误相关的大脑活动偏侧化的标志。

本研究还对经典的ERN波形进行了分析。对于ERN波,量化为电极Fz处0-100ms时间窗内的平均振幅,训练集中的平均振幅为-4.98μV(SD=4.65μV);测试集中的平均振幅为-4.48μV(SD=3.93μV)。对于Pe波,量化为电极Cz处150-350ms时间窗内的平均振幅,训练集的平均振幅为1.51μV(SD=6.78μV);测试集为1.37μV(SD=8.16μV)。训练集和测试集的ERN(p=0.595)和Pe(p=0.337)振幅没有显著差异。

内部一致性

为了比较研究结果并评估结果的稳定性,本研究报告了ERN和Pe的内部和外部变异性,以及内部一致性。不同条件(数据集类型和ROIs)下的内部一致性范围为0.53-0.98。图5显示了ERN和Pe内部一致性的摘要统计信息。

图5.在训练集(内部)和测试集(外部)中,对被试的ERN振幅(A)和Pe振幅(B)的变异性(σ)以及可靠性系数(jk)的估计。

ERN与量表得分

本研究检验了ERN振幅与自我报告量表分数之间的关联。在内部验证过程中,大多数量表与ERN之间存在显著的相关关系(p<.05),交叉验证后的R2均值在0.02-0.15之间变化(表2),但这种相关关系在不同的空间特征上存在差异。

表2.基于ERN的模型结果。

为了检验研究结果是否受到一个或多个潜在因素的影响,本研究进行了探索性典型相关分析(CCA)。在CCA中纳入了七个变量(四个与ERN相关的PCA成分和三个与焦虑相关的症状),以及三个维度。结果表明存在两个潜变量;第三个CCA维度几乎不能区分这些变量。前两个CCA维度形成了四个可见的聚类,分别用于分离思维反刍、不确定性不耐受和威胁高估,并区分它们与错误相关大脑活动的关系。图6显示了这些变量在CCA空间中的投影。

图6.基于ERN的典型相关分析(CCA)结果。

Pe与量表得分

此外,本研究检验了Pe振幅与自我报告量表分数之间的关联。Pe与量表相关的平均交叉验证R2范围为-0.3~0.2(表3)。

表3.基于PE的模型结果。

为了检验研究结果是否受到一个或多个潜在因素的影响,本研究进行了探索性CCA分析。在CCA中纳入了六个变量(三个与Pe相关的PCA成分和三个与焦虑相关的症状),以及三个维度。结果表明存在一个潜变量,可能影响PCA成分和焦虑症状之间的关系。图7显示了这些变量在CCA空间中的投影。

图7.基于Pe的典型相关分析(CCA)结果。

结论

本研究探讨了错误相关大脑活动与焦虑症状之间的关联。具体而言,ERN增加与思维反刍和威胁高估有关,而ERN减弱与不确定性不耐受相关。Pe与行为抑制、思维反刍和前瞻性不确定性相关。这些发现不仅证明了焦虑现象的多样性,并且支持了ERN是对不确定威胁的敏感性指标的观点。此外,本研究结果进一步说明了空间滤波在提取空间脑信号特征方面的优越性。个体在错误监测中的差异不仅仅受到错误监测强度的影响,还受到其他空间动态因素的影响。错误相关的大脑活动变异性可以部分通过偏侧化来解释,尤其是在行为抑制、思维抑制、威胁高估、思维反刍和自尊等方面。这一发现强调了ERP ERN振幅反映了多种认知机制,并不仅限于与错误加工强度相关的变异性。最后,本研究分析证明了统计模型容易出现过拟合的问题,并支持使用机器学习技术来提高脑-行为模型的可靠性和泛化能力。

参考文献:Anna Grabowska, Filip Sondej, Magdalena Senderecka; A Machine Learning Study of Anxiety-related Symptoms and Error-related Brain Activity. J Cogn Neurosci 2024; 36 (5): 936–961. doi: https://doi.org/10.1162/jocn_a_02126

小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值