Biological Psychiatry:CNNI|青少年抑郁症患者功能连通性的重测信度

摘要

背景:功能性磁共振成像的重测可靠性对于识别精神疾病的可重复性生物标志物至关重要。最近的研究表明,可靠性如何限制了大脑行为关联的可观察效应,阻碍了这些效应的检测。大量文献探讨了健康个体的单变量和多变量可靠性,但相对较少的研究探讨了精神疾病人群的可靠性或其与年龄存在相互作用。

方法:在此,我们对88名青少年有重度抑郁症(MDD)和无重度抑郁症(HV)展开了调研。我们比较了单变量度量,类内相关系数和2个多变量度量。

结果:青少年重度抑郁症患者的平均类内相关系数(uMDD =0.34, 95% Cl,μHV = 0.27, 95% Cl),但两组的平均类内相关系数均较差(<0.4)。指纹指数大于概率,组间差异无统计学意义。判别性表明两组的多变量置信度较高。单因素和多因素信度均与症状严重程度或组差异的边缘效应大小无关。

结论:总的来说,我们发现青春期抑郁与功能连接可靠性之间的关系证据很少。这些发现表明,与健康样本相比,抑郁症的生物标志物鉴定并不受可靠性的限制,并支持向多变量分析的转变,以提高功率和可靠性。

1. 引言

精神病学中神经影像学工作的首要目标之一是确定精神疾病与大脑的关联。然而,主要障碍是神经影像学结果的可重复性。复制危机突出了再现低功率神经成像结果的困难,尤其是功能性磁共振成像(fMRI)。这种功率的缺乏与数据的可靠性是分不开的。可靠性为任何可观察到的效应大小设置了上限,限制了统计能力。因此,量化测试-重测信度-在重复测试中测量的稳定性-对于解释结果的有效性至关重要。

然而,量化fMRI的可靠性是复杂的。较长的扫描时间和较短的扫描间隔增加了可靠性,而伪象校正会降低可靠性,强调了可靠性和效用之间的分离,因为运动等噪声可以是高度可靠的,但不能反映期望的信号。然而,测量必须是可靠的,才能具有统计能力。因此,在开发可优化的可靠性度量以提高我们识别效果的能力方面已经做出了重大努力。单变量测量,包括广泛使用的类内相关系数(ICC),在fMRI功能连通性方面通常较差,限制了我们观察单变量效应的能力。相比之下,功能连通性即使在很长的时间间隔内也具有很高的多变量可靠性,这是因为多变量方法包含了更高维度的协方差结构。换句话说,个体差异和相似点可能表现为整个连接体的模式,而不是单个连接或边缘。

尽管它在精神病学研究中很重要,但很少有研究在精神病学人群中研究功能连接的测试-重测可靠性,并将其与类似的健康人群进行比较。那些研究的重点是患有轻度认知障碍或精神分裂症的成年人群。评估精神病人群的可靠性是必要的,以确定临床生物标志物的发现是否受到效应大小减少的限制。

我们采用了单变量ICC和2个多变量可靠性测量:指纹和判别性。功能连接体指纹反映了连接体在稍后的时间点与他们自己的连接体最相关的参与者的比例。在包括青少年在内的多个数据集中观察到指纹识别的准确性远远高于偶然性,这表明功能连接数据是稳定和独特的,足以可靠地识别参与者。可判别性是一种多变量可靠性度量,对噪声具有鲁棒性,并提供了分类准确性的上限,以参与者之间测量值与参与者内部测量值的反比来衡量。

因此,我们将ICC、指纹识别和可判别性结合起来,以确定这些措施如何反映可靠性的不同方面,并为数据提供独特的视角。除了评估组间差异外,我们还探讨了信度与个体症状差异之间的潜在关联。最后,我们扩展了之前的工作,发现在精神病学背景下,更可靠的边缘与更大的预测效用无关。在进行这些分析时,我们预计抑郁症青少年的连接体比健康同龄人的连接体更不可靠,因为疾病的偶发性可能导致参与者内部随时间点的变异性增加。我们还预测了高多元信度(指纹和判别)和低单变量信度(ICC),与之前的结果一致。通过对1年内青少年连接体稳定性的描述,我们可以开始理解年龄和精神疾病如何影响fMRI临床应用的可靠性。

2. 方法和材料

2.1 参与者

参与者是NIMH CAT-D(国家精神健康表征和抑郁症治疗研究所)队列的一部分,这是一项纵向病例对照研究。青少年志愿者(12-19岁)通过邮件、在线广告和临床来源的直接推荐招募。参与者对美国国立卫生研究院机构审查委员会批准的一项方案表示知情同意。然后在美国国立卫生研究院临床中心完成问卷调查和与医生的面对面评估,以确保他们适合参加研究。未成年参与者提供同意,监护人提供同意。诊断为抑郁症的患者有资格参加门诊或住院治疗项目,由临床医生决定。健康志愿者(HVs)和最初诊断为重度抑郁症的患者均被纳入研究。参与者在评估后完成了功能磁共振成像扫描。1年后,参与者返回进行随访,包括问卷调查、临床访谈和额外的扫描。抑郁症患者每隔4个月完成一次扫描和问卷调查。

2.2 临床访谈及问卷调查

参与者通过儿童情感障碍和精神分裂症时间表进行诊断。调查问卷包括儿童自我报告:简短版情绪和感觉问卷,情感反应指数,snith - hamilton快乐量表和儿童焦虑相关情绪障碍筛查。

2.3 fMRI数据的获取

在基线和随访期间进行了现场筛查后,参与者在带有32通道头部线圈的通用电气Discovery MR750s 3T扫描仪上进行了扫描。在初始阶段,参与者被随机分配到两台扫描仪中的一台,随后每个参与者的所有扫描结果都在同一台扫描仪上收集。这两种扫描仪都被安置在美国国立卫生研究院临床中心的核磁共振套件中。固定刺激通过头部线圈镜的后投影显示。泡沫填充物用于限制头部运动。静息状态数据采集于8分钟静息期,采用T2*加权多回波平面序列,32个斜轴片(4.0 mm厚度)。为了提高激活的定位,在相同的扫描过程中,使用t1加权标准化磁化准备的破坏梯度回忆回声序列,从每个参与者收集高分辨率结构图像。在这个结构扫描过程中,所有的参与者都观看了一部关于鸟类迁徙的中性纪录片。

我们收集了202名符合纳入标准的志愿者的多回波fMRI数据。在该组中,有10名参与者由于数据收集、质量或处理方面的问题而被排除在所有报告的分析之外。为了使参与者之间的时间间隔保持一致,我们只纳入了基线期和1年期,并且只纳入了从这两个阶段获得可用数据的参与者,这导致104名参与者被排除在外。被排除和被纳入的受试者在人口统计学和临床测量方面的差异很小。在随访中被诊断为抑郁症的三名参与者被纳入重度抑郁症组。我们还探讨了扫描间隔对70名抑郁症患者的可靠性的影响,他们在基线和4个月的扫描中有可用的数据,在不同的时间点之间诊断没有变化,并且仍然使用相同类型的药物。

2.4 功能连接分析

节点的定义使用400个节点的Schaefer皮质图谱和来自稳定簇的bootstrap Analysis图谱的42个皮质下节点。研究人员还利用122个稳定簇的自举分析图谱进行了重复分析,这是一个基于1000个剑桥功能连接体项目样本开发的多尺度图谱,用于稳定表征静息状态网络。在每个聚类内对体素时间序列进行平均,并使用所得的平均时间序列计算静息状态功能连通性。我们回归了运动和生理上的混淆,并包括余弦项来控制时间漂移。心率、呼吸和每次呼吸量的回归因子是用AFNI的RetroTS.py软件从心脏和呼吸数据中创建的。以0.1 ~ 0.01 Hz的频率进行带通滤波。我们在每个轴上包含了24个运动项,平移和旋转,这些值的平方,它们的导数,以及导数的平方。使用Nilearn软件包,计算所有节点之间的两两相关性,为每个个体生成452 452功能连接矩阵。这些矩阵构成了后续可靠性分析的基础。

2.5 类内聚类系数

为了评估功能连接体的单变量可靠性,使用心理R包计算健康和抑郁人群的ICCs。我们进行了绝对一致的双向随机效应模型可靠性评估,即Shrout和Fleiss公约ICC,该公约将评分者从较大的群体中随机选择出来。我们还测量了ICC,它反映了一致性和双向混合效应(扫描仪方差固定)。参与者被引导了1000次,以确定置信区间。然后在所有边上平均icc以获得组均值。ICC值的标准通常表示为差<0.4,一般0.4至0.59,良好0.6至0.74,优秀20.75。然而,这些标签有些武断,我们在之前的文献中优先考虑情境化,并与其他解释的可靠性指标进行比较。

2.6 指纹索引

Finn等人对指纹识别进行了深入的描述。对于时间点1的每个功能连接矩阵,使用时间点2的所有连接体计算Pearson相关系数。参与者基线扫描的次数比例与他们自己第二次扫描的次数比例相关性最大时间点是该样本的指纹索引(Fl)。在每次时间点1扫描之间重复时间点2扫描之间的相关性,并将两个值平均以获得总体指纹准确性。我们还使用Horien等人的脚本计算了组一致性和微分幂。组一致性识别了指纹识别中最没用的连接,而微分幂识别了最有用的连接。

2.7 辨别性

判别性是Bridgeford等人设想的非参数多元可靠性度量。我们计算了判别性,并使用R中的MGC软件包进行了相应的统计检验。为了计算功能连接体的可判别性,我们生成了所有扫描之间的欧几里得距离矩阵。因此,对于88个参与者,每个参与者有2个功能连接矩阵,得到的距离矩阵为176 × 176距离。判别性为1减去参与者间测量距离小于参与者内测量距离的比例(即参与者第一次扫描和第二次扫描之间的距离)。

2.8 边缘水平和个人水平的可靠性关联

为了确定功能连接的可靠性是否与精神疾病的预测效用相关,我们将连接组边缘的组间差异与每个可靠性度量的边缘水平测量相关联。我们使用扫描之间的连通性平均值计算了患有抑郁症的青少年与健康志愿者的Cohen效应大小。然后,我们从所有参与者中生成3个可靠性指标的边缘水平形式如下:ICC,每条边的平均自举ICC;每个边缘的指纹、微分幂和组一致性值;判别性,省略每条边计算的z-score判别性。

2.9 边缘水平和个人水平的可靠性关联

为了确定功能连接的可靠性是否与精神疾病的预测效用相关,我们将连接组边缘的组间差异与每个可靠性度量的边缘水平测量相关联。我们使用扫描之间的连通性平均值计算了患有抑郁症的青少年与健康志愿者的Cohen效应大小。然后,我们从所有参与者中生成3个可靠性指标的边缘水平形式如下:ICC,每条边的平均自举ICC;每个边缘的指纹、微分幂和组一致性值;判别性,省略每条边计算的z-score判别性。

我们还将个人水平的测量与基线和1年后的临床问卷进行了比较。我们从原始度量标准中导出了个人水平的连续可靠性度量。对于ICC,我们使用了每个个体的参与者内方差——ICC计算中的分子。对于指纹识别,我们使用了与个人连接体的Pearson相关性。最后,对于可区别性,我们与原方法一样,生成所有扫描的欧几里得距离矩阵,然后计算小于每个参与者的参与者内距离的参与者之间距离的个数。

我们比较了从每个度量中得出的连续可靠性度量与两次访问之间的平均值和每次访问之间的值变化。我们还探讨了年龄、用药状况、青春期阶段和头部运动之间可能存在的混淆关系。

3. 结果

3.1 单变量的可靠性

抑郁症患者和hv患者的功能连通性的边缘可靠性都很差(图1)。抑郁症患者的平均ICC较高,表明可靠性更高,尽管自启动置信区间重叠。所有参与者观察到的最大ICC值为0.81。测量ICC一致性,混合效应-与ICC相比没有明显的影响。我们还测量了80名抑郁症患者在基线后4个月完成扫描的边缘可靠性。青少年抑郁症患者4个月时的边缘信度与1年时相似,表明低ICC不是扫描间隔时间较长的函数。

3.2 多元的可靠性

两组中功能连通性的多变量特征都是可靠的(图2)。通过泊松分布估计,指纹值大于偶然性。指纹识别准确率组间差异无统计学意义,尽管样本大小的差异限制了直接比较(因为较少的样本增加了匹配的机会)。差分功率分析表明,大脑中不同的连接阵列驱动了可识别性(图2C,红色部分)。由于样本量的差异,我们没有计算4个月时扫描的抑郁症青少年的指纹。

这两组都比随机更容易被辨别 (图2B)。4个月大的抑郁青少年与1岁大的抑郁青少年具有相同的可辨别性。可判别性与ICC具有确定性关系,这意味着可判别性值可以计算出可比较的ICC值。总体判别能力为0.80,对应于正态分布的全连接组距离单变量测量,ICC为0.89。

图片

图1 (A)重度抑郁障碍青少年(MDD)和健康志愿者(HV)的平均边缘水平组内相关系数(iCC)值。(B)网络组织的MDD和HV青少年的iCC矩阵。(C) MDD和HV青少年的边缘ICC值分布。

3.3 重测信度与行为和临床测量的关系

边缘的可靠性与抑郁参与者和健康参与者组间差异的边缘水平Cohen效应大小无关。MDD-HV效应大小与ICC、组一致性、差分幂和边缘可判别性之间的Spearman秩相关性较低。由于边缘的非独立性,显著性值对于这些比较来说是没有信息的,这会夸大真实的自由度。

尽管个体可判别性和运动以及snith - hamilton快乐量表得分的变化之间的相关性是中等的,但经过多次比较校正后,这些相关性并没有存在。在儿童自我报告:短版情绪和感觉问卷、情感反应指数1周或儿童焦虑相关情绪障碍筛查的变化或会话之间的连续可靠性测量之间没有观察到其他显著相关性,也没有观察到与年龄、药物状况或青春期阶段的强相关性。我们还调查了行为测量的可靠性。在临床测量中,儿童自我报告:简短版情绪和感受问卷,Snaith-Hamilton Pleasure规模和情感反应指数具有“公平”的信度,儿童焦虑相关情绪障碍筛查为“优秀”。

图片

图2 指纹(A)和群体间的可辨别性(B)。(C) 参与者的指纹识别改善最多(红色;微分功率)和改进最小(蓝色;组一致性)。

3.4 稳定聚类图谱结果的自举分析

我们在稳定集群的122节点引导分析中复制了我们的分析,允许与具有更大兴趣区域的打包进行比较。ICC的结果几乎相同,可判别性略低。指纹识别差异最大,说明包装选择对指纹识别的影响。

4. 讨论

静息状态功能连接的可靠性及其对fMRI临床应用的意义是一个开放的探索路线。我们试图通过对临床相关人群进行为期一年的多方面可靠性分析,探索这一领域的几个关键问题。与我们的假设相反,患有抑郁症的青少年表现出与健康同龄人相似的可靠性。两组在单变量水平上均表现出较差的信度,但在多变量水平上表现出较高的信度。我们还在一组患有抑郁症的青少年中重复了我们的分析他们在基线后4个月接受扫描该组的信度相似,表明尽管青少年发育,间隔时间对观察到的信度影响有限。

重要的是,单因素和多因素可靠性均与临床症状无关。因此,我们认为抑郁症的发作性对信度的影响很小。由于可靠性通过限制效应大小来限制统计能力,我们的结果可以为未来情绪障碍生物标志物的研究提供信息。抑郁症已被证明是最具挑战性的可重复性生物标志物鉴定疾病之一。不同患者的症状表现差异很大,反复发作难以预测。我们的研究结果表明,尽管连接组中存在这些潜在的不稳定性来源,但青少年抑郁症患者的fMRI功能连接的可靠性可能与HIV患者没有明显的区别。

4.1 两组的单因素信度较差但多因素信度较高

我们的发现与之前的研究一致,即静息状态连接在边缘水平上是不可靠的。Noble等人的一篇综述发现,在25项研究中,静息状态可靠性的平均ICC为0.29 。我们在多个地图集和ICC模型中观察到该范围内的ICC。某些处理步骤和扫描获取协议会进一步影响可靠性。Tozzi等人还发现,像我们这样没有全局信号回归或连通性阈值的管道可以提高可靠性。观察到的ICC值为fMRI功能连通性的低单变量信度提供了进一步的证据。尽管信度并不一定意味着有效性,但低信度限制了可观察到的效应大小,增加了i型错误的机会。因此,需要更多的参与者才有足够的能力观察单变量效应。可判别性表明在“优秀”范围内具有与icc相当的高可靠性。虽然功率和可靠性之间的关系取决于所执行的具体分析,但更高的可判别性与改进的功率相关。我们发现,可判别性作为一种多变量可靠性度量,可以捕获连接组内的稳定水平,并且对噪声具有鲁棒性。这里观察到的高多变量可靠性支持了先前的建议,即转向多变量方法可以提高功率和预测。由于连接体中的高维方差结构,功能连接的多变量可靠性可能高于单变量可靠性。虽然单个边缘可能是不可靠的,但缩小并观察更大的图像可以揭示稳定的模式,虽然这些方法可能会降低可解释性或影响定位,但与功率的增加相比,这种后果通常是适度的。

指纹识别是一种准确率,无法与其他可靠性指标相比。这一分析还强调了分组对指纹识别的影响,因为Schaefer连接体比BASC连接体更容易识别。尽管如此,Horien等人对4个数据集进行的荟萃分析发现,在类似大小的青少年数据集中观察到的Fl值与此相似。指纹识别对运动和其他噪声源很敏感,这在年轻人中往往会被放大。然而,我们没有观察到预处理后运动和指纹识别之间的关联。

4.2 抑郁症青少年的功能连接体与健康青少年的功能连接体一样可靠

我们没有观察到抑郁青少年和健康青少年在可靠性上有差异的证据。对于单变量和多变量可靠性指标,可靠性不因诊断或症状严重程度而变化。将临床测量作为可能的协变量,降低了这些结果是诊断截止值、疾病的偶发性波动或治疗的影响的可能性,这可能进一步增加生物标志物发现的难度。相反,观察到的可靠性甚至对药物、青春期发育和症状的变化都表现出很强的可靠性。

尽管先前的研究已经发现临床人群不太可靠的证据,但这些研究是在患有认知障碍的成人小群体中进行的基于任务的设计。在更大、更多样化的临床人群中进行进一步的可靠性分析,将确定我们的发现是否适用于其他精神疾病和年龄组。

4.3 可靠性与边缘或个人层面的行为无关

我们观察到任何指标的边缘可靠性与组间效应大小之间没有关联。这支持了先前的发现,即更可靠的边缘并不一定具有更大的效用——也就是说,它们并不更好地预测大脑行为关联的观察。同样,我们没有发现任何临床测量与个人层面的可靠性之间存在强关联。虽然低可靠性的边缘会模糊任何真正的效果,但高可靠性的边缘并不能保证有强大的效果。来自头部运动或呼吸频率等来源的噪音可能是可靠的,而一些处理方法,如运动回归,在增加观察真实效果的机会的同时降低了可靠性。优化可靠性是一种平衡行为,必须仔细考虑确定大脑和行为之间有意义的联系的目标。

4.4 限制

精神疾病是高度异质性的。因此,需要进一步的研究来确定这些结果是否在其他患有抑郁症或其他精神疾病的人群中复制。比较可靠性指标是困难的,本研究是解释范围给出的观点的第一步的方法。在调查信度和效度之间的关系时,我们使用组间效应大小作为边缘脑-行为关联的粗略代理,以及从我们的信度度量中得出的边缘和个人水平度量。这些都是为了反映相对的可靠性。多变量和单变量可靠性的比较是近似的,因为它们代表不同的方差维度。多变量分析和单变量分析具有独特的条件和要求,可靠性对这些分析结果的影响非常不同。我们将可判别性值转换为ICC值,以便将新度量的值置于上下文中,但这些转换应被视为实验性的。如前所述,可靠性影响检测效果的能力;因此,观察到的可靠性度量和行为度量之间缺乏关联可能是类型错误的结果。最后,测试-重测可靠性可以通过额外的扫描间隔进行更彻底的调查,例如同一天的扫描或连续几周的扫描。虽然我们在年龄、青春期状态或4个月时间点的分析中没有发现显著的发育影响的证据,但未来的工作将受益于额外的中期扫描,以更密切地检查潜在的发育影响。

4.5 结论

我们对88名患有和不患有重度抑郁症的青少年的静息状态fMRI功能连通性进行了为期1年的重新测试。抑郁青少年和健康青少年的单因素信度都较低,但多因素信度较高,支持越来越多地转向多因素模型以提高统计能力。总的来说,有证据表明,重度抑郁症患者与健康参与者相比,在可靠性上可能没有显著差异,这表明尽管在抑郁症的诊断和评估中存在可靠性问题,但功能连通性相对稳定。因此,优化可靠性和提高生物标志物鉴定的方法可能很好地适用于这一人群。

参考文献:Test-Retest Reliability of Functional Connectivity in Adolescents With Depression.

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值