人类连接组项目(HCP)的纤维束测量:资源和见解

摘要

人类连接组项目(HCP)已成为人类神经科学研究的基石,在推进脑成像方法和了解人脑方面具有重要作用。本研究专注于对HCP的扩散加权磁共振成像(dMRI)数据进行纤维示踪分析。使用了一个开源软件库(pyAFQ;https://yeatmanlab.github.io/pyAFQ)进行概率纤维束成像并描绘具有完整dMRI采集(n=1041)的HCP受试者的主要白质通路。本研究使用弥散峰度成像(DKI)对每个体素中的白质微结构进行建模,并提取沿束长度的DKI衍生组织特性的束轮廓。本研究探索了以下方面:首先,使用HCP中抽样的大量双生子对的已知遗传连锁来评估DKI组织特性的遗传性。其次,测试了与局部连接组特征相比,纤维示踪技术作为个体特征(如年龄、晶体/流体智力、阅读能力等)预测模型的能力。为了便于探索数据集,本研究创建了一个新的基于Web的可视化工具,并使用该工具可视化HCP纤维束数据集。最后,使用HCP数据集进行测试:TRX文件格式用于表示基于dMRI的流线。本研究通过AWS开放数据计划的Open Neurodata存储库将处理输出和神经束配置文件作为公开可用的数据资源发布。研究发现,在一些大脑通路中,基于DKI的指标的遗传度高达0.9。此外,与局部连接组方法一样,纤维示踪提取了很多关于个体差异的有用信息。本研究发布了一个新的基于web的纤维示踪可视化工具——“Tractoscope”(https://nrdg.github.io/tractoscope)。研究结果发现,TRX文件需要的存储空间大大减少,这对于像HCP这样的大型数据集来说是一个至关重要的属性。此外,TRX还包含了对流线进行分组的规范,进一步简化了示踪分析。

前言

人类连接组项目(HCP)是研究大脑宏观连接组结构和功能的一项开创性工作。HCP的WU-Minn-Ox联盟通过收集1200名年轻成年双生子和非双生子兄弟姐妹的大型数据集来进行研究,该数据集包括结构(T1加权和T2加权)、功能(有任务和无任务(即“静息态”))和扩散加权MRI(dMRI)测量,以及基因型信息和行为测试。一些被试还接受了额外的电生理测量和7T MRI测量。HCP推动了最先进的MRI测量方法的发展,开发了大量新的数据采集、数据处理和分析技术,并创建了新的数据组织和传播方法。

HCP数据集中的dMRI测量利用了几项技术创新,其中包括使用专门的硬件,特别是一套强大且快速的梯度系统,最大梯度强度可达100mT/m,有效转换速率可达91mT/m/s。使用多层和多波段激发的并行成像技术来加速每个体积的采集。该方法可以在大量不同的方向上进行测量,具有多个不同的非零b值(分布在三个壳层中:b≈1000s/mm2,b≈2000s/mm2,b≈3000s/mm2),并且具有1.25×1.25×1.25mm3的高空间分辨率。除了这些先进的采集技术,HCP还开发了新的处理方法,以解决由于运动和涡流引起的伪影,并解决由于磁化率导致的几何失真。因此,HCP生成的数据在空间和角度分辨率方面远远超过大多数临床环境下可能实现的水平,即使在十年后也是如此。因此,这些dMRI数据提供了人类白质连接组的独特视角。

对dMRI数据进行的追踪分析侧重于主要白质通路的物理特性。它利用计算纤维束成像和解剖约束来勾画dMRI数据中已知解剖纤维束的位置,并提取每个通路长度上的脑白质组织特性。纤维束测量提供了关于脑组织特性和个体差异的重要信息,但对于像HCP这样的大型数据集,应用最前沿的纤维束测量方法需要专门的专业知识,并且计算量很大。本研究通过提供1041名已完成全套dMRI测量的HCP受试者的示踪测量结果,并基于这些数据建立一套见解和资源,使我们能够在HCP数据集中研究大脑连接。使用pyAFQ软件(https://yeatmanlab.github.io/pyAFQ)确定数据集中每个受试者的24个主要白质通路(表1)。本研究使用概率纤维追踪来勾画这些通路,并使用开源软件DIPY(https://dipy.org)中的弥散峰度成像(DKI)描述白质组织的特性。之所以使用DKI,是因为它扩展了扩散张量成像(DTI),通过测量扩散模式与高斯分布的偏差,提供了更全面的扩散评估。此外,先前的研究表明,DKI比DTI更准确、更可靠地描述了HCP dMRI数据。在这里,本研究还使用DKI的扩展模型,以提供有关主要白质通路长度上轴突白质比例的额外信息。该处理的结果通过AWS Open Data计划在Open Neurodata存储库中公开提供,并提供了访问此数据的示例。

表1.以TRK和TRX格式保存的纤维束(缩写)。

本研究使用这个开放数据集作为平台来检查数据的几个不同方面。首先,本研究描述了白质通路长度的组织特性的总体分布。利用样本中大量的同卵和异卵双生子数据来表征DKI组织特性沿通路长度的遗传性。最后,本研究比较了通路特性与其他扩散处理方法的预测能力。组织特性的通路特征可用于比较不同的被试群体或了解个体差异。本研究将局部连接组(LC)方法提供的信息与更简明的示踪法所提供的信息进行了比较。开放访问标准的HCP示踪数据集将有助于促进未来关于脑-行为相关性分析的其他研究。

方法

数据

如前所述,dMRI数据由人类连接组项目(HCP)收集。简而言之,数据是在配备32通道线圈的3T西门子Skyra MRI系统上采集的,该线圈经过修改以适应Gmax=100mT/m的梯度(优化梯度占空比后,最终以Gmax=97.4mT/m进行采集)。采用多波段多层回波平面成像,TR为5.5s,TE为89ms。采集了三个扩散加权壳层:b≈1000s/mm2、b≈2000s/mm2、b≈3000s/mm2,并且每个壳层中都使用了相同的TR/TE。在每个壳层中,选择了90个非共线方向,以优化壳层内部和之间的覆盖范围,从而在每个壳层中采集了190个数据点,对应于逆相位编码方向(LR和RL方向)的测量值和五次非扩散加权采集。数据的空间分辨率为1.25×1.25×1.25mm3。

本研究使用了由HCP提供的数据,这些数据使用HCP最小预处理管道进行处理。简而言之,基于非扩散加权图像(b0图像),对六个采集系列进行强度归一化。这些b0图像也使用FSL的“topup”工具来估计和校正EPI失真。使用FSL的“eddy”工具对涡流和运动引起的伪影进行校正。计算了梯度空间非线性。使用FreeSurfer的“BBRegister”算法计算平均b0图像和T1加权数据之间的空间变换。通过梯度非线性校正和T1w配准,将涡流校正后的数据转换到1.25mm的结构体积空间。

示踪分析

本研究应用pyAFQ管道进行高级示踪分析。利用pyAFQ拟合约束球面反卷积(CSD),并将其用作纤维取向分布函数,用于在DIPY中实现概率纤维束成像。使用对称归一化(SyN)的微分同胚非线性配准将受试者配准到MNI模板。基于包含感兴趣区(ROI)和排除感兴趣区(ROI)的组合,在模板空间中定义了24个不同的白质束。其中16个来自原始AFQ模板,另外8个来自胼胝体束。每个束的ROI都使用SyN定义的逆变换转换成个体受试者的解剖坐标。根据流线是否通过每个纤维束的包含ROIs并且没有通过排除ROIs,作为纤维束选择的额外标准。在进行初始选择后,可能还会根据它们是否为极端异常值来排除个别流线。如果流线与其他流线的马氏距离大于3个标准差,或者其长度超过平均长度5个标准差,则视为异常值。这种异常值排除进行了五轮,类似于原始的AFQ过程。使用DIPY对DKI模型进行拟合,创建了以下微结构组织特性图:FA(分数各向异性)、MD(平均扩散率)、MK(平均峰度),以及来自白质束完整性(WMTI)模型的轴突水分数(AWF)。在每个束中,每个流线都重采样为100个节点,并通过这些位置对FA、MD、MK和AWF图进行采样生成纤维束图。每个流线在每个位置的贡献根据该节点到流线位置中位数的距离进行加权,距离越远,权重越小。

评估纤维束特征的遗传性

从HCP数据集中收集同卵(MZ)和异卵(DZ)双生子的数据,使得可以用Haseman-Elston回归法评估测量特征的遗传关联性或遗传力,计算公式如下:

通过同源一致性来评估遗传关联性πi(即,MZ的πi=1.0,DZ的πi=0.5)。根据公式2来估计特定位置或特定纤维束上组织属性的遗传力。

评估纤维示踪数据中的大脑-行为相关性

本研究将纤维束测量生成的纤维束特征作为正则化预测模型的输入特征,以研究纤维束测量与各种认知和非认知表型的脑行为相关性。使用LASSO正则化线性模型分别预测每个表型,其中输入特征是来自24个纤维束的100个节点级FA、MD、MK和AWF测量值。LASSO正则化线性模型通过将模型系数权重降至零来去除不重要的特征。除了LASSO正则化模型外,纤维束特征自然的分组形成(即纤维束和组织特性)为利用此类分组的模型提供了机会,例如稀疏组LASSO(SGL)。除了收缩单个特征外,SGL还将整个组收缩至零,同时消除了无信息的特征和组。作为比较,本研究还使用另一种组织特性描述(局部连接组)来创建LASSO模型。该方法计算了沿纤维束邻近位置之间自旋密度的q空间归一化图,生成了大量的特征(LC中每个受试者有128894个特征,而纤维束特征为9600个)。这些特征也被用作LASSO正则化模型的输入特征。使用嵌套的5折交叉验证来确定用于拟合和评估的正则化水平。为了评估模型的可靠性,每个模型运行了100次,使用不同的交叉验证分割。模型通过外样本决定系数R2评估预测能力,并通过不同CV分割下模型权重的95%置信区间评估可靠性。

TRX和TRK比较

默认情况下,pyAFQ使用TrackVis文件格式(TRK)生成输出。然而,对于本研究的应用程序来说,这种格式存在一些限制。首先,该格式无法在单个文件中表示多个纤维束,需要使用多个文件来表示所有纤维束。其次,TRK文件很大且读取速度很慢,这两者都会影响在线数据可视化和分析。因此,为了测试新的TRX格式并将其与TRK性能进行比较,本研究将pyAFQ处理过程中生成的完整和分段示踪图从TRK格式转换为TRX格式。这两种格式的数据均可在Open NeuroData AWS bucket获取。TRX格式允许用户设置示踪图坐标/顶点的数据类型,本研究选择将示踪图保存为半浮点数类型,并且还使用了TRX内置的zip压缩选项。重新计算了TRK和TRX文件中的纤维束特征,同时分析了时间和内存使用情况,以比较它们的性能。

Tractoscope

本研究开发了一个基于Web的应用程序来可视化HCP中的数据。该应用程序使用Vue JavaScript框架和NiiVue软件包构建。应用程序直接连接到AWS buckets,并使用AWS buckets提供的REST API来查询是否存在预期文件,并将文件呈现到浏览器窗口中。该应用程序利用Pinia数据存储库(https://pinia.vuejs.org/)来封装和管理应用程序运行所需的大量数据。源代码可在GitHub存储库中(https://github.com/nrdg/tractoscope)获取。

结果

公开可用的pyAFQ HCP衍生数据

pyAFQ在处理每个步骤中生成的所有衍生数据都可以通过AWS开放数据计划的Open Neurodata bucket获取。单个随机选择的受试者(受试者ID:550439)的示踪结果如图1所示。图2和图3显示了所有受试者的所有纤维束和组织特性的平均束轮廓。

图1.在随机选择的HCP受试者(受试者ID:550439)中识别的一些纤维束。

图2.所有HCP受试者的16个标准非胼胝体pyAFQ束的平均轮廓。

图3.所有HCP受试者的8条胼胝体pyAFQ束的平均束轮廓。

组织特性的纤维束特征的遗传性

束轮廓的遗传率在组织特性、束和每个束内都有所不同(图4、5)。对所有束和束上的各位置进行平均后,不同组织特性的遗传性如下:FA:h2=0.33±0.17,D:h2=0.29±0.15,MK:h2=0.42±0.25,AWF:h2=0.47±0.2。

图4.所有HCP受试者的16个标准非胼胝体pyAFQ束的遗传力概况。

图5.所有HCP受试者的8个胼胝体pyAFQ束的遗传力概况。

基于束特征的脑表型模型的准确性和可靠性

使用正则化回归模型评估脑表型相关性(图6)。为了评估相关性的准确性,使用交叉验证来减少拟合数据中过拟合的可能性,并使用自举法来评估该估计的变异性。对于示踪测量和LC特征,准确性在各种表型之间有所差异。虽然在某些表型(例如年龄和阅读能力)中,LC和束特征的预测存在一些表型上的差异,但研究结果发现使用这两种方法提取特征的模型在准确性和可靠性方面没有显著差异。

图6.根据表型预测模型的性能。

虽然模型选择对模型准确性没有显著影响(表2),但LASSO和SGL模型的权重可靠性却有所不同(表3)。在各个表型中,LASSO倾向于为个别节点分配较高的模型权重,并且在自举法中具有较大的方差。相比之下,SGL会为束内的相邻节点分配较小的模型权重,并且在自举法中模型权重的方差要小得多(图7)。这种模式在所有表型中都存在。

表2.每种表型的SGL和LASSO模型权重的差异。

表3.每种表型和模型的平均准确性。

图7.预测年龄的束轮廓模型中各节点的模型权重。

TRX为示踪测量数据提供了一种高效存储的文件格式

为了评估TRX文件格式的性能,本研究使用以TRX文件格式存储的数据计算每个束轮廓,并计算了TRX/TRK的耗时比率(图8A)。除了在某些情况下从TRX计算轮廓明显比TRK更快外,两种文件格式之间的性能并没有本质上的差异。同样,TRK和TRX的内存使用量非常相似(图8B)。本研究还计算了沿束长度的FA比率(图8C)。尽管数值精度有所降低且文件大小也大幅减少(图8D),但束轮廓的所有差异均小于0.1%。

图8.比较TRK和TRX文件格式。

一个用于可视化HCP示踪测量结果的应用程序

使用Tractoscope web应用程序可以在无需下载任何数据的情况下评估并查看示踪测量结果。Tractoscope可以兼容TRK和TRX文件格式,使用户能够轻松地浏览和可视化HCP数据集以及其他符合类似BIDS布局的数据集中的纤维束成像文件。该工具可在https://github.com/nrdg/tractoscope上公开获取。该应用程序目前支持可视化HCP数据集(图9),以及Richie-Halford等人(2022)研究中的HBN-POD2数据集。

图9.使用Tractoscope对示踪测量结果进行交互式可视化。

结论

HCP等数据集的开放可用性促进了合作研究,同时也推动了研究方法的进步。使用pyAFQ对HCP扩散MRI数据进行示踪测量分析,并通过Tractoscope进行可视化,突显了开放访问数据的实际益处。不同的研究小组可以利用共享的组织特性来更详细地了解白质通路,这对于神经系统疾病、大脑发育和认知功能等方面的研究至关重要。本研究创建的这些资源的潜在用途包括:(i)作为常模样本,与不同的患者群体进行比较,(ii)与HCP在同一受试者中收集的其他数据(如fMRI测量值)整合,(iii)进一步探索白质组织特性与其他表型测量之间的关系,(iv)作为了解人脑白质结构的教育资源。

参考文献:Kruper J, Hagen MP, Rheault F, Crane I, Gilmore A, Narayan M, Motwani K, Lila E, Rorden C, Yeatman JD and Rokem A (2024) Tractometry of the Human Connectome Project: resources and insights. Front. Neurosci. 18:1389680. doi: 10.3389/fnins.2024.1389680

小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~

  • 17
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值