阿尔茨海默病及其先兆分期的神经影像分类研究及相关特征提取

最新推荐文章于 2023-04-21 09:26:31 发布

思影科技

最新推荐文章于 2023-04-21 09:26:31 发布

阅读量3.6k

点赞数 5

文章标签：阿尔茨海莫氏病大脑结构机器学习

本文链接：https://blog.csdn.net/cc1609130201/article/details/120503197

版权

神经影像学的发展使在活体检测与阿尔茨海默病(AD)相关的大脑病理变化成为可能。在过去的十年中，通过分类框架，这些检测方法被越来越多地整合到AD的成像特征中，为个性化诊断和预后提供了很好的工具。本文回顾了基于神经影像的AD和轻度认知障碍（MCI）分类研究，这些研究是在Google Scholar和PubMed在线数据库搜索后选择的(1985年1月至2016年6月)。根据以下神经成像模式对这些研究进行分类(并根据从这些模式中提取的特征作为后处理步骤，进行了再分类)：

i)结构磁共振成像(MRI)(组织密度、皮质表面和海马测量)；

ii)功能MRI(不同脑区的功能一致性，以及功能连接的强度)；

iii)扩散张量成像(白质纤维走型)；

iv)氟脱氧葡萄糖正电子发射断层扫描(FDG-PET)(大脑葡萄糖代谢率)；

v)淀粉样蛋白-PET（淀粉样蛋白负担）。

本文表明基于这些特征制定的分类框架在个体化诊断和预测临床进展方面有发展前景。最后详细介绍了AD分类面临的挑战，并讨论了一些未来的研究方向。本文发表在Neuroimage杂志。

简介

阿尔茨海默病(AD)是痴呆症最常见的形式，预计到2050年，世界上每85人中就有1人受到影响。AD的病理生理机制正变得越来越清晰。AD患者的大脑以淀粉样斑块和神经纤维缠结的形式积聚异常蛋白(Aβ和tau)，最终导致神经元丧失。AD引起的大脑变化甚至在失忆症状出现之前就发生了，并且发生变化的大脑结构通常包括颞叶和海马体。根据结构磁共振成像(sMRI)的测量，有人认为这种几乎必然会出现的结构萎缩可能可以作为神经变性的一个有价值的标志。使用功能磁共振成像(fMRI)和氟-脱氧葡萄糖正电子发射断层扫描(FDG-PET)可以检测到功能、连接性和新陈代谢的进一步变化。然而，AD早期阶段变化的微妙性使得传统的放射学读数甚至是定量分析都难以轻易区分模式。因此，建立可靠的标记物来诊断和监测早期阶段和个体的疾病进展仍然具有挑战性。许多神经影像研究已经使用感兴趣区(ROI)类型的分析来研究与AD相关的微小变化(Chetelat和Baron，2003；Lerch等人，2008)。这类研究仅仅依靠先验知识来指导ROI和特征的选择，因此忽视了研究区域以外的大脑变化，无法发现新的知识。机器学习在开发复杂的、自动和客观的分类框架方面提供了一种系统的方法，用于分析高维数据，并且可以学习各种成像模式中复杂而微妙的变化模式。通常，分类框架至少包括特征提取和分类算法，以建立预测模型，促进医疗决策支持的自动化，并在这些决策中提供更高的客观性。此外，分类框架可用于开发具有高灵敏度和高特异性的个体成像标志物或指标，其可将受试者的成像情况总结为一个有意义的数值。这创造了一种更加个性化、适合病人的方法，这在当前的个性化医学时代是至关重要的，因为它可以通过利用先进的计算能力，进一步考虑遗传或生活方式的风险。近年来，基于神经影像，关于AD及其前驱阶段--轻度认知功能障碍(MCI)的计算机辅助分类研究已发表大量成果。由于AD/MCI分类研究的迅速普及，以及缺乏从神经影像数据和分类算法中提取的不同AD相关特征的文献总结，我们对这一领域的相关进展进行了综述。我们总结了基于神经影像的AD/MCI分类的主要代表性研究，并简要介绍了这些研究的主要方面，如研究人群、特征类型、采用的分类算法和报道的分类成功率。此外，我们强调了几个瓶颈(即有限的样本量和不同研究中数据设置的可变性)，并讨论了现有AD分类研究的普遍性和可重复性，以及AD中重要且基本未被探索过的异质性问题。最近的论文(ArBabishani等人，2017年；Falahati等人，2014年)报告了关于基于MRI和多模态的AD和MCI分类的研究，将AD分类仅限制在MRI或其与其他模态的组合。与AD相关的病理性脑改变可以通过各种独立的成像手段来捕捉，如FDG-PET和淀粉样蛋白-PET，因此，对AD分类的全面综述还应包括仅使用FDG-PET和淀粉样蛋白-PET的研究。本文的独特之处在于，它只关注那些广泛利用交叉验证策略来评估其分类框架性能的研究。交叉验证通常被设计为实现分类算法的独立训练和测试数据，并被定义为将数据分割一次(在训练测试中分割)或多次(k折交叉验证)，以获得对算法分类性能的公正估计，并避免过度拟合。在训练-测试划分中，数据被随机分为独立的训练子集和测试子集，这些子集最好具有匹配的人口统计学特征。训练子集仅用于分类算法的学习过程，而测试子集用于评估训练后的分类算法的性能。在k-折交叉验证中，数据被分成k-折，分类算法在第k次迭代中对k-1折进行训练后，在第k折上进行测试。此外，我们还提供了从各种神经成像模式中提取AD相关特征的方法的深入细节，这些重要信息在现有的综述论文中大多是缺乏的。

选择标准

本文的研究者在PubMed和Google Scholar中进行了检索，从1985年1月到2016年6月，根据给定的搜索标准确定了409项研究。纳入专门使用交叉验证策略来评估其分类框架性能的原始同行评议研究。此外，为方法比较而进行的研究和不主要关注AD分类的研究被排除在本综述之外。最后，根据这一标准筛选出了81项研究，并在此进行了回顾和介绍。补充资料中提供了对搜索和筛选过程的更详细的解释，包括流程图以及在Google Scholar和PubMed中搜索生成的数据库。

图1. 基于神经影像学的AD分类框架的顶层布局

阿尔茨海默病及其前驱疾病的分类框架

在过去的十年中，分类框架已被成功地用于分析神经影像数据中的复杂模式，以期对AD和MCI受试者进行分类。分类框架由四个主要部分组成：特征提取、特征选择、降维和基于特征的分类算法。如图1所示，特征提取和分类算法是最低要求的部分，而其他部分可以根据需要应用。在满足其他标准的前提下，具有分类框架最低要求的研究被认为是有可能被纳入本文的候选项。在特征提取过程中，AD相关的特征都是从训练对象的不同神经影像模态中提取出的，如结构MRI、功能MRI、扩散张量成像(DTI)、淀粉样蛋白PET和FDG PET。术语“特征”指的是对原始医学成像数据进行后处理，以获得更多测量信息。这种衍生测量的例子包括区域组织密度、区域皮质厚度等。这些衍生测量可以从数百万(当所有体素被用作特征时)到几个(当从大脑中提取几个代表性测量时)不等。从各种模态提取的特征可以单独使用，也可以组合使用，以利用几种模态所提供的互补信息。然后，在提取的特征上训练一个分类算法(预测模型)，以在预测认知正常(CN)和患病对象时提供诊断支持。

在上述分类框架中，为了获得更高的AD分类预测率，在所获取的成像数据中选择合适的模态以及准确的特征提取方法，通常比选择底层分类算法更重要。因此，我们为本文中纳入的研究提供了更多关于特征提取的详细信息描述。总体而言，本文分为几个不同的部分，每个部分侧重于从一种特定成像模态(如结构MRI、功能MRI、DTI和PET)中提取的特征。最后一部分是对于多模态AD/MCI分类研究的描述，主要内容为如何将从各种成像模式中提取的特征组合在一起，从而利用它们的互补信息。

图2.基于结构MRI的AD分类研究的顶层分类

基于结构磁共振成像的研究

脑神经退行性变化的特点是突触早期受损，随后轴突退化，最终树突树和神经细胞核周细胞萎缩。这种神经退化过程在大脑的某些部分更为严重，例如左右海马、颞回和扣带回以及楔前核(。这种由神经退行性病变引起的不可避免的萎缩，通常可以用结构MRI来测量，并作为个体AD病理神经退行性方面侵袭性及AD阶段的有价值的标记。这些区域的萎缩过程导致了大脑结构的明显变化，如皮质表面变薄、几个脑区的结构变化和局部组织密度的变化，这些变化已经在几个基于神经影像学的AD分类研究中得到了证实。这些研究的顶层分类如图2所示。主要包括三种用于评估结构变异的特征提取方法：i)密度图，ii)皮质表面，iii)基于预定义区域的方法。表1.简要说明用于验证基于密度图的AD分类框架的数据集

基于密度图的方法

基于密度图的方法通过利用白质(WM)、灰质(GM)和脑脊液(CSF)的密度图来量化萎缩的模式，这些密度图是由基于体素的形态测量法(VBM)或归一化空间中体积的区域分析(RAVENS)生成的。根据密度图的使用方式，这些方法可以进一步分为两类：i)整个密度图作为特征(DMAF)，以及ii)降维的密度图特征。表1列出了属于这些类别的研究。基于整个密度图作为特征(DMAF)的方法。该方法的核心是利用WM和/或GM的密度图来构建一个特征向量进行分类。在早期的一项研究中，利用整个大脑的GM密度图与支持向量机(SVM)一起，实现了AD的有效分类(Kloppel等人，2008年)。在该研究中，在AD受试者的海马区发现了相对较低的GM密度，这是海马萎缩的一个很强的指标，与先前的研究一致(Frisoni等人，2002年)。此外，通过采用大规模正则化方法（Casanova等人，2011年）和空间增强的线性编程提升方法（LPBM）（Hinrichs等人，2009年），GM图已被用于AD分类，并通过使用SVM（Adaszewski等人，2013年）预测从MCI到AD的转换。Termenon等人使用GM密度图来开发AD分类的特征向量(Termenon和Graña，2012)，采用两阶段的分类框架，其中在第一阶段使用相关性向量机分类器(Tipping，2001)。在预测中，将落入分类器低置信度区间的对象作为第二个分类器的输入。第二阶段分类器采用SVM、最近邻、相关向量机和学习矢量量化，然而，SVM效果更好。最近，Moller等人(2016)还使用GM密度图用于基于SVM的AD分类。此外，通过使用SVM、Bayes统计和投票特征区间分类器，从这些密度图中计算出的雅各布行列式被用作预测从MCI到AD的转换的特征（Plant等人，2010）。这些方法在AD分类上达到了≥81%的准确率，在AD转换的预测上达到了≥62%的准确率。此外，Termenon和Graña(2012)提出的两阶段分类框架比基于单阶段的分类框架表现出更高的分类准确率(从77%到87%)。

基于降维的密度图特征的方法：基于DMAF的方法存在维度上的缺陷，因为特征的数量通常大于或相当于可用对象的数量。当特征数目相对于训练集中的对象数目较高时，训练集中产生高精度的分类规则可能只是偶然产生的。这可能导致许多分类算法无法推广成为新数据的分类规则。因此，使用有监督或无监督的特征降维方法来降维特征，或者已从预定义的图谱和自适应区域中提取特征以降维。

基于监督/非监督特征降维方法：这些方法主要是以有监督或无监督的方式将大尺寸密度图提取为较少的、有意义的特征。在无监督方法中，Salvatore等人使用主成分分析(PCA)对WM和GM密度图进行降维。降维的密度图被用于基于SVM的AD分类和从MCI到AD的转换预测(Salvatore等人，2015年)。此外，Liu等人(2013)使用局部线性嵌入方法将多变量区域脑体积和皮质厚度MRI数据转换到维数更少的局部线性空间，同时也利用了全局非线性数据结构。嵌入的大脑特征随后被用来训练分类算法，例如正则化逻辑回归(RLR)、支持向量机(SVM)和线性判别分析(LDA)。另一方面，Behehti和Demirel(2015)提出了以有监督的方式降低GM图维度的方法。他们使用GM图的体素的强度分布作为特征，而不是使用GM图的所有体素的强度作为特征。基于Fisher准则最大化AD和CN受试者之间的强度分布，选择最优的强度分布箱数，并将所得到的基于强度分布的特征用于基于SVM的AD分类。基于图谱的方法：这些方法依赖于基于预定义的解剖标记图谱(例如自动解剖标记(AAL)图谱(Tzourio-Mazoyer等，2002)和神经成像实验室(LONI)图谱(Shattuck等，2008))将大脑图像划分成几个解剖区域，然后从这些特定区域提取特征。例如，Magnin等人用AAL将大脑图像分成116个区域，然后用GM的相对权重与WM和CSF的相对权重相比，来开发基于SVM的AD分类的特征向量(Magnin等人，2009年)。

基于自适应ROI的方法。传统上，基于图谱的方法被用来获得解剖学特征的区域测量，并调查疾病状态下的异常组织结构。然而，在实践中，异常区域的先验知识并不总是可用的。即使可以对特定的ROI做出先验假设，显示异常的区域也可能是单个ROI的一部分，或者跨越多个ROI，因此潜在地降低了进一步分析的意义。因此，为了降低密度图的维数并解决这一问题，自适应感兴趣区被计算出来。此外，根据计算的自适应ROI集合的数量，这些方法可以分为两类：i)单集合自适应ROI，ii)多集合自适应ROI。在基于单图谱自适应ROI的方法中，受试者被配准到一个特定的图谱，并且在该图谱间中计算自适应ROI和相应的区域体积测量。在早期的工作中，Fan等人计算了Ravens密度图，并使用基于分水岭聚类算法的方法(Fan等人，2007年)，使用多中心ADNI(阿尔茨海默病神经成像计划(Weiner等人，2015))数据集，计算了用于基于SVM的AD分类的自适应ROI集。他们报告了高达94.30%的交叉验证分类准确率，其模式涉及许多颞叶GM区、海马周围WM和CSF(Fan等人，2008a)。本研究中训练的SVM被用来确定识别早期AD(Spare-AD)指数的异常空间模式，该模式后来在巴尔的摩老龄化纵向研究(BLSA)(Davatzikos等人，2011年)数据集的CN和MCI受试者中进行了独立测试。在随后的研究中，同样的分类框架被用于MCI分类(Davatzikos等人，2008年)和从MCI向AD转换的预测(Misra等人，2009年)。在基于多图谱自适应ROI的方法中，受试者被配准到多个图谱，并且在每个图谱空间中计算自适应ROI和相应的区域体积测量，以克服只使用单一图谱存在的固有偏差。例如，Min等人使用亲和传播法(Frey和Dueck，2007年)，从不重叠的受试者群中导出多个图谱(Min等人，2014年)。他们将受试者配准到图谱上，并在每个图谱空间自适应地计算一组ROI和体积特征。将从每个图谱空间计算出的K个最具区分度的特征组合起来，用于基于SVM的分类。随后，Liu等人提出了自己的观点。他认为，从K组自适应ROI中提取的特征是同一主体的不同表示(Liu等人，2015年)，不应该像之前的一项研究那样串联起来(Min等人，2014年)。为了解决这个问题，Liu等人(2015)将受试者配准到不同的选定图谱，并从每个图谱配准的图像的自适应区域提取特征，将该图像视为主要来源，而将所有其他图谱配准的图像作为辅助来源。SVM分别对每套图像中提取的特征进行训练，并使用多数投票机制将多套图像的结果合并。

基于多图谱自适应ROI的方法非常有效，与基于单图谱自适应ROI的方法相比，AD/CN分类准确率从84.18%提高到92.51%(Liu等人，2015年)，进行性MCI(pMCI)/稳定MCI(sMCI)分类准确率从70.06%提高到78.88%(Liu等人，2015年)。

基于皮质表面

AD患者通常表现出皮质表面颞叶区域和顶叶区域的变化(Bakkour等人，2009；Dickerson等人，2009,2011)。虽然这些变化在AD的早期阶段不容易被看到或测量，但分类框架已经能够通过分析复杂的皮质表面数据来检测皮质表面的细微变化，这是对以体素方式提取的区域体积图的补充。从曲面的所有顶点提取皮质表面度量值。这些度量值或者直接使用，要么通过应用特征降维方法来降维，从而产生两个主要类别：i)顶点作为特征的方法，以及ii)降维的顶点作为特征的方法。表2中列出了使用基于皮质表面特征的AD诊断支持的研究。表2.用于验证基于皮质表面的AD分类框架的数据集的简要描述

皮质顶点数据作为特征的方法:

这一系列的AD分类框架仅依赖于从皮质表面的所有顶点计算出的特征。例如，Li等人计算了软脑膜表面每个顶点的各种形态特征，包括体积(皮质厚度、表面积和GM体积)和几何(沟深度、度量失真和平均曲率)测量(Li等人，2014b)，用于基于SVM的MCI分类。

降维的皮质顶点数据作为特征的方法：

使用所有顶点的皮质表面特征存在相同的维度缺陷，其原因类似于基于降低密度图特征维度部分。因此，这些特征要么通过特征降维方法进行降维，要么从预定义图谱中的区域提取。

基于监督/非监督特征降维的方法：

在这些方法中，由大脑所有顶点的特征组成的长特征向量的维数通过应用有监督或无监督的特征降维方法来减少。例如，Cho等人(2012)将厚度数据转换到频域，并通过滤除高频(噪声)分量来实现低维度。他们采用了基于增量学习的LDA来减少基于数据集的AD分类。Park等人通过使用三维网格对皮层表面进行建模来解决这个问题，并通过这些网格提取皮层厚度参数(Park等人，2012)，用于基于SVM的AD和MCI分类。后来，Park等人(2013)将这一分类框架应用于纵向数据，用于AD的早期检测。他们在MCI和CN受试者上训练SVM，并在转换为AD的受试者身上进行测试，使用的是实际转换前一个时间点的受试者图像。他们实现了从MCI到AD转化的早期预测(83%)。

基于图谱的方法：

在这类方法中，原始脑图像被配准到某些标准化的立体定位空间(Fischl等人，1999年)，并计算出皮质图/特征(Fischl和Dale，2000；Jones等人，2000；MacDonald等人，2000)，并使用现有的图谱模板将其镶嵌到不同的区域(Desikan等人，2006年)。与在体积空间中使用的基于降低密度图特征的方法一节中讨论的结构模板不同，这些图谱模板是在曲面空间中使用的。将镶嵌区域的特征用于特征向量的开发，然后将特征向量用于分类。Desikan等人使用Logistic回归(LR)将所有方格区域的平均皮质厚度用于MCI和AD的分类(Desikan等人，2009年)。事实证明，与其他区域的皮层厚度相比，内嗅皮质和缘上回的皮层厚度是预测MCI的一个更好的指标。同样，Oliveira等人(2010)使用区域厚度测量和整个大脑的平均厚度通过SVM进行AD分类。他们发现，与区域厚度特征相比，整个大脑的平均皮质厚度可以更好的预测AD。Wee等人(2013)使用了区域厚度测量、大脑皮质GM和相关的WM体积以及相关特征，这些特征是基于两个大脑区域之间的皮质厚度的相似性而获得的。首先使用t检验选择特征，然后使用最小冗余和最大相关性(MRMR)(Peng等人，2005年)结合支持向量机递归特征消除(SVM-RFE)来选择特征。采用多核支持向量机进行分类。McEvoy等人（2009）也使用平均区域皮质厚度和体积测量来进行基于LDA的AD分类和预测从MCI到AD的转换。Lillemark等人(2014)使用不同大脑区域的质心和表面连通性百分比之间的接近程度作为基于LDA的AD和MCI分类特征。最近，Eskildsen et al.。(2013)通过测量MCI向AD转换的不同阶段的区域厚度，研究了AD转换的预测。为此，根据转化为AD的时间(6个月、12个月、24个月或36个月)对pMCI受试者进行了分类，每一类受试者都与sMCI受试者进行了分类。使用mRMR减少特征，并使用LDA来确定分类精度。基于pMCI受试者特定阶段类别的分类比pMCI和sMCI受试者的总体分类显示出更高的准确性。此外，在两个独立的队列(ADNI和AddNeuroMed(Lovstone等人，2009,2007))和这些队列的集合(ADNI+AddNeuroMed)中，使用正交偏最小二乘法对AD分类进行了区域厚度测量的有效性研究(Westman等人，2011年)。结果显示，两个单独队列的萎缩模式相似，表明两个队列中涉及AD分类的关键区域是相似的。他们通过在一个队列上训练分类算法，并在另一个队列上进行测试，进一步证明了萎缩模式的相似性。例如，通过对AddNeuroMed队列进行训练，并对ADNI队列进行测试，得到AD的分类，反之亦然，准确率分别为86.0%和83.40%。单个队列和合并队列进一步用于预测从MCI到AD的转变。例如，在组合队列上训练的分类算法将71%的pMCI分类为类AD，将60%的SMCI分类为类CN。降维的顶点作为特征的方法比原始顶点作为特征的方法表现出更高的分类精度，这表现在对于不同的受试组，分类精度提高了10%-13%(Park等人，2012年)。此外，基于监督/非监督特征降维的方法比基于图谱的方法具有更好的分类精度。与基于图谱的方法相比，不同受试组的总体改善幅度为2-8%(AD/CN为86.67-88.33%(Cho等人，2012年)，pMCI/SMCI为65.22-71.21%(Cho等人，2012年))。

基于预设区域的方法

这些方法是基于先前对组织学或成像数据进行的研究获得的AD的大小和空间模式的先验知识(Baron等人，2001年；Frisoni等人，2002年)。通常，一些重要区域的特征被提取并用于分类，这些区域已被证明包含与AD相关的判别信息。表3中列出了使用这些方法进行研究的数据集和分类精度。表3. 用于验证基于预定义区域的AD分类框架的数据集的简要说明

海马特征：海马是内侧颞叶中少数在AD患者中发生严重结构变化的结构之一(Braak和Braak，1991)。阿尔茨海默病(AD)和健康人的海马结构差异已被深入研究过(Killiany等人，2002年；Wisse等人，2014年)。在一些AD和MCI分类研究中，海马的几何特性已被用作有用的生物标记物。例如，由球面谐波(Gerardin等人，2009)、基于表面的解剖模型(Li等人，2007)、统计形态模型(Shen等人，2012)以及大变形微分同形度量映射和PCA(Wang等人，2007b)量化的海马形状，已被证明是AD和MCI分类的有效生物标志物。海马的形状和体积特征也被结合起来，用于基于SVM的AD转换预测(Costafreda等人，2011年)。有趣的是，一项研究表明，在基于SVM的MCI到AD转换的预测中，海马纹理比其体积缩小在预测性能方面更具优势(Sorensen等人，2016年)。

根据生物学进行的特征选择:

AD影响的脑区远远不止海马，如内嗅皮层萎缩(Dickerson等人，2001年)，脑室扩张(Ridha等人，2008年)，以及其他皮质下核团(杏仁核、壳核、尾状核和丘脑)的体积变化(Madsen等人，1312；Visser等人，1999年)。对海马区以外的结构进行分析，不仅可以提高对阿尔茨海默病空间模式的理解，还可能产生更准确的诊断。因此，这些根据生物学进行选择的区域特征有时被直接用于将受试者分为正常和患病类别。例如，Chincarini等人(2011)使用了内嗅皮层、嗅周皮质、海马和海马旁回的统计和纹理特征。利用随机森林分类器对每个区域的特征进行分析，提取相关特征，然后用SVM进行AD转换预测。最近，Tang等人提出了自己的观点(2015)，使用LDA对左右杏仁核、海马、丘脑、尾状核、壳核、苍白球和侧脑室的形状差异形态计量学进行了AD转换的预测。

基于功能磁共振成像的研究

AD的神经退变过程引起了大脑不同区域之间的功能连通性改变(Fransson，2005；Wang等人，2007a)。这些改变通常是在患者休息时使用静息态功能磁共振成像(rs-fMRI)测量的。原则上，RsfMRI通过量化血氧水平依赖信号来测量大脑活动，由于血流的增加，在大脑的激活区域可以观察到血氧水平的增加。各种rs-fMRI研究已经报道了静息态网络的存在，其特点是血氧水平依赖信号的空间连贯性和自发波动，并由通常参与大脑功能的区域模式组成，如注意力、感觉或默认模式处理(Fox and Raichle，2007；Seeley等人，2007)。一个与AD相关并越来越受到关注的网络是默认模式网络(DMN)(Greicius等人，2003,2004)，也称为“任务负”网络(与“任务正”网络反相关)(Fox等人，2005；Fransson，2005)，因为它的活动在没有任务的时候会增加。AD通过破坏其功能活动损害主要脑目标，如DMN(He等人，2007年；Li等人，2002年)，以及主要目标与大脑其余部分之间的功能连接(Wang等人，2007a，2006年)。一些研究报告说，功能变化早在临床症状的变化变得明显之前就出现了(Pievani等人，2011年；Teipel等人，2015年)。然而，这些研究很少，应该进行更多的研究，以测试功能性MRI的改变是否可以在结构性MRI之前出现。功能连接紊乱的初步证据(Li等人，2002；Wang等人，2007a，2006)以及它与AD的关联促使研究人员假设：对不同大脑区域的功能连接进行适当的量化，可以捕捉到AD异常的全球分布，并可以进一步帮助AD分类(Chen等人，2011；杰等人，2014)。这种量化包括根据大脑结构模板对fMRI数据进行空间分割，以及计算所有区域对的激活之间的成对连通性。连通性信息，一般定义为两个区域的fMRI时间序列之间的相关性、协方差或互信息，被存储在每个受试者的n×n矩阵中，其中n是通过模板分割得到的脑区数量。然后，连通性信息被用作分类的输入。例如，Chen等人(2011)使用Pearson相关系数作为基于Fisher LDA的AD和MCI分类的连通性度量。此外，Challis等人(2015)使用协方差作为连通性度量，用于基于高斯过程、Logistic回归模型的AD和MCI分类。他们的研究结果表明，内侧结构与颞部和皮质下区域之间的连接强度对MCI的分类效果最好，而额叶区域与大脑其他区域之间的连接强度对AD的分类效果最好。还有人建议在连通性矩阵上开发图，并从图中计算网络度量，而不是使用原始连接矩阵。例如，Jie等人提出从图中提取基于全局拓扑和基于局部连接的特征。最小绝对收缩和选择算子用于特征选择，而多核SVM被用于MCI分类(Jie等人，2014年)。类似的，Khazaee等人(2015)从图表中计算整合和分离度量，并使用Fisher分数进行特征选择，使用SVM进行AD分类。总体而言，基于功能连接性的方法显示出良好的分类结果(AD/MCI的分类结果为97.00%(Challis等人，2015年)，MCI/CN的分类结果为91.90%)(表4)。

表4. 用于验证基于功能磁共振的AD分类框架的数据集的简要描述

基于扩散张量成像(DTI)的研究AD与限制水运动的脑屏障的丧失有关，从而损害WM的完整性，并导致异常的扩散模式(Xie等人，2006年)。DTI被用来分析大脑微观结构层面的水扩散，以确定AD的异常扩散模式。基于体素的研究表明，AD患者在多个后部WM区域的分数各向异性(FA)降低(Medina等人，2006年)，而MCI患者在枕顶后皮质和右顶缘上回的平均弥散率(MD)增加(Rose等人，2006年)。基于ROI的研究表明，海马区有更高的MD和/或更低的FA(Fellgiebel等人，2006年；Kantarci等人，2001年；Muller等人，2005,2007年)，并且后扣带区也处于AD的临床前阶段(Choo等人，2010年；Fellgiebel等人，2005年)。有趣的是，先前的一项研究表明，对于MCI转化的预测，海马的扩散率测量是比体积更好的预测因子(Fellgiebel等人，2006年)。异常和复杂的扩散模式的证据引出这样的假设：这些生物标志物可以使用高级分类框架进行AD分类(Selnes等人，2013年)。根据如何提取特征，表5中总结的基于DTI的特征的研究被分为三类：i)纤维追踪法，ii)连通性网络测量，以及iii)判别性体素选择。

表5. 用于验证基于DTI的AD分类框架的数据集的简要说明

基于纤维追踪的方法

在这种方法中，根据解剖图谱，通过纤维追踪定位的纤维被聚集成不同的纤维束。定位的纤维被简化为紧凑的低维表示，计算出的纤维扩散指标被用于分类。例如，Nir等人(2015)使用纤维追踪法定位纤维，然后根据约翰霍普金斯大学概率WM图谱中定义的18个区域将它们聚集成18个纤维束。他们计算密度图来量化通过每个体素的纤维数量，并基于最大密度路径(MDP)使用最短路径图搜索将纤维束减少到紧凑的低维表示。这些MDP在不同受试者之间配准，根据所有MDP计算的FA和MD的扩散指标被用作基于SVM的AD和MCI分类的特征。基于连通性网络测量的方法在该方法中，DTI图像被分割成若干个解剖区域，并从这些区域内的纤维计算出若干特征。基于这些区域(即特征)开发连通性网络，并导出用于分类的网络度量指标集合。在此背景下，Wee等人(2011)将大脑划分为不同的解剖区域，并基于纤维计数、纤维上FA、MD的平均值和三个主要扩散系数的区域特征建立了连接网络。以所有区域的聚类系数为特征，计算所有网络的聚类系数。通过确定Pearson相关系数对特征集进行降维，并采用SVM-RFE进行MCI分类。最近，Prasad 等人(2015)采用了相同的方法，并根据纤维计数和沿纤维区域的流动特征开发了两个连通性网络。原始连通性矩阵和其他各种网络度量指标(如全局效率、传递性、路径长度、模块性、半径和直径)，被用于对早期和晚期MCI受试者进行基于SVM的分类。基于鉴别体素选择的方法在该方法中，选取有鉴别力的体素来降低DTI数据的维数，并将所选体素的扩散度量作为分类特征。Dyrba等人在他们的两项研究中采用了这种方法。在第一项研究中，他们使用PCA和基于熵的信息增益标准来选择鉴别体素，并使用FA、MD的扩散度量和所选体素的各向异性模式作为基于SVM的AD分类的特征(Dyrba等人，2013年)。在随后的研究中(Dyrba等人，2015a)，他们使用相同的分类框架对MCI受试者进行分类，按其淀粉样蛋白负荷阳性或阴性分层。

基于正电子发射断层扫描(PET)的研究脑FDG-PET上葡萄糖代谢的特征模式和淀粉样PET上淀粉样蛋白沉积的特征有助于区分AD和健康人。在几个大脑区域，如顶颞叶和后扣带回皮质(Mosconi等人，2008年)和海马区(Mosconi等人，2005年)，发现AD和低代谢之间存在关联。类似地，与健康人相比，AD患者在整个皮质和所有皮质区域(楔前、扣带前、扣带前和扣带后，以及额叶正中、颞叶和额叶)显示出更高的淀粉样蛋白负荷。这些低代谢和淀粉样蛋白负荷与阿尔茨海默病相关的证据鼓励使用FDG-PET和淀粉样蛋白PET作为AD分类的合适生物标志物。FDG-PET最近，人们对使用大脑葡萄糖代谢率进行AD分类和预测从MCI到AD的转换越来越感兴趣(Gray等人，2012；Toussaint等人，2012)。这里考虑了四种利用大脑葡萄糖代谢率的主要方法：基于体素作为特征(VAF)的方法、基于鉴别体素选择的方法、基于图谱的方法和基于投影的方法。表6列出了使用这些方法的研究，以及它们的数据集和相应的分类性能。表6. 用于验证基于FDG-PET和淀粉样蛋白-PET的AD分类框架的数据集的简要描述

基于VAF的方法。

该方法与结构MRI中讨论的基于整体密度图作为特征(DMAF)的方法相似，利用了PET扫描的所有体素的强度值。Hinrichs等人(2009)使用LPBM对AD分类采用了这种方法。基于鉴别性体素选择的方法：这些方法的突出目标是同时选择基于VAF的方法中使用的信息性体素(特征)。例如，Cabral等人(2015)使用该方法研究了基于不同时间点的FDG-PET图像的AD转换的预测。利用互信息准则选择图像的鉴别体素，并利用SVM和高斯朴素贝叶斯进行分类。与pMCI和sMCI的总体分类相比，基于pMCI的阶段性分类显示出更好的预测准确性，Eskildsen等人(2013年)也证明了此结果。基于图谱的方法。一些基于FDG-PET的AD分类研究是基于利用预定义的结构图谱将FDG-PET图像分割成不同的解剖区域。Pagani等人(2015)使用分割区域之间的平均区域强度和半球间对称性作为基于SVM的MCI分类的特征。类似地，Gray等人(2012)使用基线和12个月随访扫描的平均区域强度，以及这两个时间点之间的强度差异作为基于SVM的分类的特征。在这项研究中，当同时使用纵向和横向特征时，准确率提高了1-2%。基于降维的方法：基于映射的方法通过将高维特征空间投影到低维空间来降低特征的维度，其中每个特征相对于手头问题的重要性可以用其方差来度量。因此，可以选择具有相对较大方差的特征子集用于进一步计算。在此背景下，Padilla et al(2012)将非负矩阵分解投影应用于输入图像。然后，他们选择了这些投影的几个子集，并使用SVM对它们进行了分类。最终，将从多个投影获得的分类结果组合在一起以获得最终预测。结果表明，与基于VAF的方法相比，该方法对同一数据集的分类准确率提高了17%。淀粉样蛋白-PET脑淀粉样蛋白负荷(β-淀粉样蛋白)的活体测量可能对正在被评估为可能的AD的认知障碍患者的管理有临床意义。一些放射性配体被用于测量淀粉样蛋白负荷，例如11C-匹兹堡化合物B(11C-PIB)和18F标记的淀粉样蛋白-PET 示踪剂，包括氟倍他平、氟他莫和氟倍他滨。一些基于群体分析的研究显示，不同受试者群体中不同大脑区域淀粉样蛋白负荷存在差异；AD(Klunk等人，2004年)和MCI受试者(Camus等人，2012年)的淀粉样蛋白负荷高于健康人，pMCI受试者高于sMCI患者(Koivunen等人，2011年；Okello等人，2009年)。然而，很少有人注意到不同脑区斑块水平的量化及其在AD分类中的应用。Vandenberghe等人(2013)提出了一个这样的分类框架，在该框架中，他们使用18F-Flutemetamol PET扫描的所有体素的强度值作为特征，用于基于SVM的AD与健康人的分类，以及pMCI与sMCI受试者的分类。多模态研究一些生物标志物已经显示出与AD相关，包括脑脊液中的蛋白质(Melah等人，2016年)，大脑萎缩，特别是通过结构磁共振测量的海马(Frisoni等人，2002年)和扣带回后部(Baron等人，2001年)，以及通过FDG-PET测量的与AD相关的颞叶和顶叶以及后扣带皮质的低代谢(Herholz等人，2002年；Langbaum等人，2009年)。此外，AD大脑表现出不溶性β淀粉样斑块和神经纤维缠结的形成(Jagust，2013年)，并已提出β淀粉样蛋白的数量可能与疾病的阶段相关(Murpy和Levine，2010年)。

图3. 基于多模态的AD分类研究的顶层分类这些生物标志物产生互补的信息，即不同的模式从不同的角度捕捉疾病信息，从而提高了对疾病模式的理解，而不是一种模式所呈现的模式。分类框架有助于利用从多个模态获得的互补信息。图3显示了两种分类框架的顶层分类，即直接的特征级联和专用融合框架，用于利用多模态数据进行AD分类。图中的集成框架是专用融合框架的一个示例。术语F1、F2、...、Fn-1、Fn分别是从1、2、...、n-1、n个模态或其他生物标记物中提取的特征集。符号C1、C2、...、Cn-1、Cn分别表示在特征集1、2、...n-1、n上训练的分类算法。表7总结了使用这些框架进行研究的结果和相应的数据集。表7. 用于验证各种基于多模态的AD分类框架的数据集的简要描述

简单的特征级联

利用多个模态提供的互补信息的最简单方法是将这些模态的特征连接成单个特征向量，并在该特征向量上训练一个分类器。结构磁共振成像是这些研究的一个关键组成部分，它的特征已经与从各种其他模式提取的特征相结合，以改进分类。在此背景下，不同的作者将基于结构MRI的特征与由DTI和功能MRI计算的特征相结合。在早期的研究中，根据结构MRI计算的区域体积测量指标和从WM区域计算的FA被结合用于基于SVM的MCI和AD分类(Cui等人，2012年；Li等人，2014a)。在最近的研究中，唐等人(2016)使用海马和杏仁核的体积、形状和扩散特征进行AD分类。他们使用PCA和Student's t检验来对特征集进行降维，使用LDA和SVM来进行分类。同样，Schouten 等人(2016)结合了根据功能MRI计算的所有大脑区域之间的区域体积测量、扩散测量和相关性测量。他们采用Logistic弹性网络(Zou和Hastie，2005)进行分类。结构核磁共振与人口统计学、认知测试和遗传数据的结合也在一些研究中得到了探索。例如，Vemuri等人(2008)将GM、WM和CSF密度图与年龄、性别和载脂蛋白E基因型相结合，用于基于SVM的AD分类。Zhang等人(2014)使用GM密度图、颅内体积、寰椎比例因子、归一化全脑体积和年龄作为AD和MCI分类的特征。该特征集通过使用Kernel SVM决策树(SVM决策树的一种变体)进行分类。最近，Moradi等人提出(2015)使用GM密度图、年龄和认知测试作为特征，并使用低密度分离和随机森林等分类算法进行AD转换预测。MRI结构特征与PET和CSF生物标记物的结合是另一个维度。在早期的研究中，Fan 等人(2008B)结合区域体积测量和区域FDG-PET强度，使用SVM进行MCI分类。除此之外，Spare-AD指数(Davatzikos等人，2009年)与CSF生物标记物(Davatzikos等人，2011年)相结合，使用SVM预测从MCI到AD的转换。此外，Dukart 等人首先使用所选ROI的所有体素的FDG-PET和GM密度值(Dukart等人，2011a)，然后使用所选ROI的所有体素的平均值用于基于SVM的AD分类(Dukart等人，2013年)。在最近的研究中，Zhu等人(2014)结合区域GM体积、区域平均FDG-PET强度和CSF生物标志物作为特征，提出了一种基于矩阵相似度的损失函数，用于SVM更好的分类。类似地，Apostolova等人。(2014)使用海马体积和脑脊液生物标记物进行基于支持向量机的AD和MCI分类。结构MRI、PET和CSF生物标记物与遗传数据和神经心理状态检查分数的结合也很常见。例如，SPARE-AD与认知评分、APOE基因型和CSF生物标记物(Da等人，2014年)相结合，以预测从MCI到AD的转换。类似地，Kohannim等人(2010)结合海马、心室和颞叶体积、FDG-PET数字汇总、CSF生物标志物、APOE基因型、年龄、性别和体重指数，用于基于SVM的AD和MCI分类。此外，Cui 等人(2011)将结构性MRI的平均区域皮质厚度、厚度标准差、平均区域表面积和皮质体积与CSF生物标记物和神经心理状态检查得分相结合。利用mRMR进行特征降维，采用SVM进行分类。最近，Zheng等人提出了自己的观点(2015)，使用区域厚度度量、区域相关度量(根据厚度度量计算)和APOE基因型进行基于SVM的AD分类和AD转换预测。

专门的融合策略

虽然直接拼接的简单性可能被认为是可取的，但该方法存在一个重大缺陷：因为它将所有特征等同对待，所以它无法解释从不同模态提取的特征的不同性质(Hinrichs等人，2011年；Liu等人，2014年)。例如，如果一种模态比另一种模态有更多的特征(或者具有更大规模的变化)，基于合并的特征训练的分类算法可能会产生有效忽略其他模态的预测模型。可以使用专门的融合策略来确保在所有模态中发现的互补信息都能被使用。这些策略可以结合对单个模态训练的分类规则的结果(Dai等人，2012年)，也可以在训练前使用特殊的组合规则来组合特征(Dyrba等人，2015b；Zhang和Shenin，2012；Zhang等人，2011年)。这些策略被用来利用从结构MRI、rs-fMRI和DTI提取的特征的互补信息来进行AD分类。Dai等人(2012)使用区域GM体积度量和功能度量(低频波动幅度、区域同质性和区域功能连通性强度)作为特征。他们分别对结构和功能度量的最大不确定性LDA分类器进行训练，并通过加权投票将分类器的输出组合在一起。最近，Dyrba 等人(2015B)使用区域GM体积测量、FA、MD的平均束强度和各向异性模式，以及从rs-fMRI计算的加权局部聚集系数和最短加权路径长度的网络测量作为特征。他们采用多核SVM进行AD分类。此外，从结构MRI和PET图像中提取的特征以及CSF生物标志物也使用这些策略进行了融合。在此背景下，区域GM体积、区域平均FDG-PET强度和CSF生物标志物被用作AD和MCI分类以及多核学习(Zhang和Shenin，2012；Zhang等人，2011年)和多任务学习(Yu等人，2016)的特征。同样的特征也被用于通过域迁移学习(Cheng等人，2015b)和半监督多模态流形正则化迁移学习(Cheng等人，2015a)预测从MCI到AD的转换。最近，Liu等人(2014)使用CSF生物标志物，以及图谱定义的感兴趣区中海马和GM体积的形状测量，使用多核SVM进行AD分类。Xu等人(2015)提出使用FDG-PET和Florbetapir图像的GM体积、区域平均强度作为特征。他们使用一种基于稀疏表示的分类方法，对AD和MCI受试者以及pMCI和SMCI受试者的不同模式的特征赋予不同的权重。Zu等人(2015)使用区域GM体积和区域平均FDG-PET强度对AD和MCI进行分类，并使用多核支持向量机进行分类。此外，这些策略也被用来开发结构MRI、PET和CSF生物标记物的特征，以及遗传数据和神经心理状态检查分数。在早期的研究中，Hinrichs等人(2011)使用基于结构MRI的密度图、FDG-PET强度、CSF生物标记物、APOE基因型和神经心理状态检查分数作为基于多核支持向量机的AD分类和AD转换预测的特征。Young等人(2013)使用区域GM体积、区域平均FDG-PET强度和CSF生物标志物以及APOE基因型，并采用高斯过程分类器对AD和CN受试者进行多核训练，并在pMCI和SMCI受试者上进行测试。另外，Gray等人(2013)在区域GM体积测量、CSF生物标志物、基于体素的FDG-PET强度和APOE基因型上训练随机森林分类器，用于AD和MCI的分类。Casanova等人(2013)将Spare-AD指数与GM、WM和CSF密度图、海马总体积、区域体积和皮质厚度测量以及认知评分相结合，用于AD分类和使用大规模RLR预测从MCI到AD的转换。在最近的研究中，Korolev等人使用皮质和皮质下体积、平均皮质厚度、表面积和曲率，从结构MRI、临床测量和血浆测量预测AD转换。他们使用互信息标准进行特征选择，使用概率多核学习进行分类(Korolev等人，2016年)。同样，Clark等人也是如此，他们使用了认知评分、皮质厚度测量、海马和脑室体积以及年龄、性别和教育程度。他们用随机森林选择特征，并使用条件树、SVM、朴素贝叶斯和多层感知器组成的随机森林进行分类(Clark等人，2016年)。总体而言，这一类别下的多模式技术比单一模式有不同程度的改善，从1%到7%不等。几乎所有的方法都显示出一些改进，然而，与仅使用DTI测量相比，使用多模态数据并没有观察到性能方面的改进(Dyrba等人，2015b)。讨论神经影像研究的最新进展表明，AD的病理可以在临床前阶段检测出来(Perrin等人，2009年)。因此，基于神经成像的AD/MCI分类和AD转换预测已成为一个重要的研究领域，这些研究使用各种神经成像手段，如结构MRI、功能MRI、DTI和PET。在这篇综述中，我们只介绍了那些使用适当的交叉验证策略来评估其分类框架性能的研究。在各种神经成像方法中，结构磁共振成像是最常用的，可能是因为它的广泛可用性。第二种最常见的方法是将一种或多种模式的特征与诸如遗传数据、认知评分和CSF生物标记物等数据水平相结合。基于FDG-PET、淀粉样蛋白PET、DTI和功能MRI提取特征的研究不太常见。本文综述的大多数研究的主要目的是从高维原始神经影像数据中产生和选择与AD相关的固有特征。因此，我们根据特征提取方法对属于每种模态的分类研究进行了分组。脑萎缩最常通过组织密度图(Casanova等人，2011年；Kloppel等人，2008年)、皮质/皮质下厚度测量(Desikan等人，2009年；Wee等人，2013年)以及海马几何测量(Costafreda等人，2011年；Gerardin等人，2009年)进行量化。在功能强度(Chen等人，2011年；Koch等人，2012年)和弥散测量(Prasad等人，2015；Wee等人，2011年)的基础上开发的连接网络,分别是功能MRI和DTI中最常见的特征提取方法。同样，分割脑区的葡萄糖代谢率测量在FDG-PET中也很常见(Gray等人，2012年；Pagani等人，2015年)。这些自动特征提取方法生成用于进一步分析的高维数据。各种各样复杂且成熟的监督分类算法，如支持向量机(SVM)和线性回归(LDA)，已经被应用于不同的研究中，将提取的神经影像特征用于AD/MCI分类或AD转换预测。对神经影像数据应用分类算法的主要优势是，可以在AD的前驱阶段，甚至在临床表现之前检测AD的潜在可能性(Misra等人，2009年；Park等人，2013年)，表明其未来可能可以常规应用于临床。在广泛的分类算法中，SVM是最常用于AD分类的算法(Apostolova等人，2014年；Cui等人，2012年；Kohannim等人，2010年；Padilla等人，2012年)。多核学习是基于普通核的分类算法的扩展，也越来越多地被用于AD分类(Dyrba等人，2015b；Liu等人，2014；Zu等人，2015)。其他在AD研究中不太常见的分类算法有LDA(Lillemark等人，2014；Don等人，2015)、正交偏最小二乘回归(Westman等人，2011)、随机森林(Moradi等人，2015)、基于正则化的方法(Casanova等人，2011)、集成学习算法(Liu等人，2015)、核支持向量机决策树(Zhang等人，2014)和LPBM(Hinrichs等人，2009)。虽然与神经网络等其他分类算法相比，支持向量机可以在小训练样本量下实现高分类精度(Shao和Lunetta，2012)，但它们可能存在需要参数调整的缺点(Chapelle等人，2002年)。对于基于神经成像的AD分类，由于到目前为止只进行了有限数量的研究，因此在不同分类算法之间进行彻底比较仍然很重要。这里总结的特征提取方法受到几个因素的影响，这些因素在不同的研究中有所不同。一个因素是结构MRI和FDG-PET的空间平滑，这通常是为了解决噪声(即配准误差)而执行的。去噪通常采用“全宽-半极大值”的高斯平滑方法。值得注意的是，太小的内核大小可能会导致错过可能出现组差异的许多区域。反之，过大的核可能会让展示与其他区域差异的区域中的图像特征模糊化。由于核大小的选择是临时性的或经验性的，因此还没有一个最佳解决方案。大多数研究使用8 mm的高斯核用于结构MRI(Misra等人，2009年；Moradi等人，2015年)和FDG-PET(Gray等人，2013年；Pagani等人，2015年；Zhang等人，2011年；朱等人，2014年)。然而，其他尺寸的核，例如用于结构MRI的10 mm(Dai等人，2012年；Plant等人，2010年)和用于FDG-PET的15 mm(Fan等人，2008b)，很少被使用。影响基于图谱的方法的另一个因素是图谱本身的选择。使用预定义的解剖脑图谱进行基于图谱的分割是一种方法简单、计算容易的特征提取方法，具有普遍的通用性(Ota等人，2015年；Zhang等人，2011年)。然而，图谱的选择会对分类性能产生影响。研究表明，在类似的实验条件下，基于不同解剖分区提取的特征会导致分类性能的差异(Ota等人，2014,2015)。这些分类性能上的差异可能与图谱之间的分割变化有关，例如小脑区域。LONI概率脑图谱将小脑视为一个单独的区域，而AAL图谱将小脑精细地划分为26个较小的区域。除了特征提取和分类之外，特征选择对于识别区分特征也很重要。选择合适的特征不仅可以去除非信息性信号，还可以减少分类所需的计算时间。两种广泛采用的特征选择方法是生物信息特征选择和自动特征选择。前者依赖于关于某些区域鉴别能力的先验生物学知识，通常是从现有文献中获得的，而后者则基于一般数据特征来选择特征，不需要先验知识。在自动化方法中，各种基于排名的方法，例如t检验(Don等人，2016；Wee等人，2013年)和Pearson相关系数检验(Davatzikos等人，2008；Wee等人，2011)，基于包装器的方法，基于排名和基于包装器的方法的组合，如mRMR(Wee等人，2013)，以及嵌入式方法，如弹性网络回归，都被应用于所回顾的研究，并提高了分类性能。特征选择方法的不同会导致AD分类性能的不同，这是可以理解的。有人提出，与基于生物信息的特征选择相比，自动特征选择不会提高分类准确性，这是由对典型受AD影响的区域(如海马、杏仁核、丘脑和尾状核)的先验生物学知识驱动的(Chu等人，2012年)。在匹兹堡脑活动解释大赛中也观察到了类似的结果，其中应用先验生物学知识进行特征选择的团队(Chu等人，2011年)的表现优于使用自动特征选择的团队。此外，在最近的CADDementia 2015挑战赛(Bron等人，2015年)中，获胜的方法(Sørensen等人，2014年)也是基于生物学知识的特征选择。

AD分类研究比较

本文以表格的形式总结了每个分类研究的关键部分，如预测精度、研究人群和特征类型。应该强调的是，这些表格是为了提供每个单独研究的概览，而不是用于比较的目的。在回顾这些研究的过程中，作者经常指出，他们提出的分类框架仅仅是基于达到的准确性而优于现有的分类框架。然而，我们认为，考虑到每项研究涉及的因素数量之多，总结如下，很难直接对这些研究进行比较，因此很难就整个领域的状况得出一般性结论。

随访期长度

在不同的研究中，定义MCI转换的随访期长度也不同，最短6个月，最长36个月不等。众所周知，随着MCI受试者从CN状态向AD状态的连续发展，神经退行性变化的水平以及AD的预测率也随之增加(Cabral等人，2015年；Eskildsen等人，2013年)。因此，我们认为，考虑到追踪期的不同长度，不同研究的预测性能不能直接进行比较。研究群体研究人群的基本特征，如性别、年龄、基因型(APOE)和教育程度被认为是AD分类中的混杂因素。这些因素可能会对从神经成像模式中提取的关键特征产生深远的影响，从而影响最终的分类精度。AD分类研究通常在如何处理混杂因素，即需要考虑的混杂因素的数量以及如何考虑这些混杂因素等方面有所不同。过去，混杂因素的处理主要是根据因素将受试者分成不同的组，或者将混杂因素作为统计模型中的协变量，以便从模型中消除它们的影响。然而，这一问题近年来受到越来越多的关注，现在已经提出了几种自动化方法来控制混杂因素的影响(Dukart等人，2011b；Li等人，2011年)。损伤程度对于AD的客观的、最终的诊断只能通过尸检作出，因此很少使用(Kloppel等人，2008年)。即便如此，尸检时的疾病阶段可能与扫描确定的疾病阶段有很大的不同。另外，AD(McKhann等人，2011)和MCI(Petersen，2004)的临床诊断标准在实践中被用来作为评估的参考标准。基于这些标准的MCI诊断导致了临床上受损程度较高和较低的病人的异质性组合，每个病人都呈现出从CN到AD的连续疾病阶段(Misra等人，2009年)。当MCI被作为一个诊断实体使用时，MCI受损更严重的组可能会显示出与健康个体更大的结构差异，从而可能导致更高的分类准确率。

评估指标

在这里回顾的一些研究中，分类性能仅在分类准确率方面进行了报道。在不平衡的数据集中，分类准确度的测量本身可能是信息不足的，不能用于比较。例如，在包含90个患病个体和10个健康个体的数据集中，90%的分类准确率不传达任何信息，因为将所有受试者分类为患病的偏向分类算法也可能导致90%的分类准确率。因此，我们认为，为了直接比较结果，应该报告平衡的准确性、敏感性/特异性或精确度/召回率，以及接受者-操作特征曲线下的面积。影响分类算法性能的因素分类算法的预期性能由两个因素决定。第一个是训练集中的受试者数量，第二个是测试集中每个类别受试者的相对比例。第一个因素很大程度上取决于可供训练的样本大小，以及实验中使用的交叉验证策略。训练集中的样本越多，分类算法的泛化能力越强。第二个因素可能会影响分类精度，因为分类算法的敏感度和特异度可能因分类相对比例的不同而不同。这一因素可能更容易修正，因为分层变得越来越普遍，不同类别的受试者是根据匹配的人口统计特征来选择的。分类框架中采用的分列检验（split-in-train-test）或k重（k-fold）交叉验证策略的选择影响分类准确率的统计学意义(Mendelson等人，2014年)，分类准确率可以通过二项式或排列检验来计算(Noirhomme等人，2014年)。split-in-train-test假设训练集和测试集之间是独立的，这也是二项式测试的关键。然而，split-in-train-test通常可以限制在一些医学应用中，其中分类算法是针对少量对象进行训练的。因此，k重交叉验证更常用。K-折交叉验证不需要独立性假设，因为不同迭代中的训练对象可能重叠；因此，置换检验用于评估k-折交叉验证策略的统计显著性是可行的(Noirhomme等人，2014年)。有人建议应该使用10折或5折交叉验证来确定偏差和方差之间的权衡(Lemm等人，2011年)。此外，还建议将置换检验与交叉验证一起使用，特别是在处理小样本量时(Noirhomme等人，2014年)。

AD分类研究面临的挑战泛化能力

AD分类框架临床应用的一个关键挑战是预测模型的能力，该模型可以对新的患者数据进行良好的泛化。理想情况下，无论成像方案、扫描仪(Abdulkadir等人，2011年)和人口统计学的变化如何，模型都应该能够很好地运行，并且应该没有重复使用，这是较早的研究中非常常见的现象。术语重复使用或循环分析指的是在训练过程的任何部分使用测试对象，例如特征选择和分类算法的训练，可能导致过拟合的分类(Kriegeskorte等人，2009年)。为了进行公平的验证，应该避免重复使用，将分类算法后续验证中使用的测试对象排除在分类算法的特征选择和训练过程之外。在较早的研究中，重复使用在特征选择中相当常见(Querbes等人，2009年；Wolz等人，2011年)；然而，随着它的影响变得越来越明显，这种情况已经变得不那么常见了。为了鼓励可推广到新数据集的分类框架的开发，神经影像学界组织了更多的AD分类挑战，在这些挑战中，不同的研究人员试图通过利用最先进的技术在公开数据集上解决分类问题。例如，2015年CADDementia 2015挑战赛(Bron等人，2015年)的目的是衡量基于结构性MRI的分类研究在未见受试者身上的普适性，其中表现最好的研究产生了78.8%的接收操作特征曲线下面积。同样，DREAM 2016挑战赛(Allen等人，2016年)的主要目标是为了识别认知能力下降的准确生物标志物，以推进早期诊断。这些挑战赛不仅有助于确定任何研究的泛化性，而且还可以对同一数据集上的不同研究进行公平的性能比较，否则，由于不同研究的实验条件不同，这是不可能做到的。此外，人们已经努力对同一数据集上的不同研究进行标准化比较，例如在Cuingnet等人的研究中，作者使用ADNI数据集评估了10项研究的性能(Cuingnet等人，2011年)。

样本量

通常认为，较小的数据集不能捕获不同类别之间的全部异质性，因此，在未见过的患者数据上可能不太具有泛化性，而对于较大的数据集则相反。然而，在CADDementia 2015挑战赛(Bron等人，2015年)中看到了截然不同的结果，在较大的训练集上训练分类算法的研究(Abdulkadir等人，2014年；Eskildsen等人，2014年)并不比在相对较小的数据集上训练分类算法的研究表现更好。因此，训练一个可推广的分类模型所需的最小样本大小仍然存在争议。

可重复性

忽视分类框架的适当包装(使用不同数值的解决方案可能导致不同的实验条件)，以及使用本地数据集或较大公共数据集的子集而没有提供详细的受试者水平识别，是阻碍现有结果的可重复性和研究结果之间比较的主要因素。我们强烈建议报告从公共数据集得出的结果，并适当列出受试者，就像在一些研究中所做的那样(Moradi等人，2015年；张等人，2011年)。我们还建议作者关注代码的适当包装和可用性，特别是在使用了复杂的特征提取和分类算法的情况下，因为这可以显著提高可重复性。AD的异质性AD的异质性要求定义不同的AD临床病理亚型。虽然AD的典型定义是使用Braak分期，但非典型的阿尔茨海默病病例并不适合这个方案。例如，最近的一项研究表明，避开海马体及边缘叶占优势的AD亚型可能约占AD病例的25%(Murray等人，2011年)。简单的测量方法，如海马与皮质体积的比率，显示出在亚型之间有很高的辨别能力(Whitwell等人，2012年)。其他研究使用基于聚类的方法来定义AD模式；最近的一项研究利用了皮质厚度聚类，表明早期AD可以分为不同的解剖亚型，具有不同的临床特征(Noh等人，2014年)。通过纳入额外的生物标记物，如脑脊液和血清生物标记物，出现了四个具有不同生物标记物模式的聚类，其中第一个在生物学上与健康人相似，很少转化为AD(Nettiksimmons等人，2014年)。我们认为，在现有的AD分类研究中，AD模式的异质性被普遍忽视了，今后应该更多地关注这一方向的研究。能够处理不同成像模式的工具的开发很重要，应该成为一个重点领域(董等人，2016,2017；Varol等人，2017)。对异质性的系统量化很可能是利用机器学习开发有效的个性化诊断和预测工具的关键。总结：在过去的十年里，越来越多的文献报道了基于神经影像的AD和MCI的分类，作为一种获得这些疾病的个体生物标记物的手段。AD分类的最终目标是通过应用已在大量疾病和健康个体上训练过的分类模型，使用单次MRI扫描产生个体诊断，并在早期疾病阶段预测未来的发展。本文中讨论的几种神经成像方法，包括结构和功能MRI、DTI、FDG-PET和淀粉样蛋白-PET，已经显示出AD和MCI患者大脑的特征性改变，这些改变有助于帮助排除AD的病理生理过程。没有一种单一的神经成像方式是足够的，因为每种方式都有互补的优点和局限性。结合来自多个模态的信息，提高了AD/MCI和AD转换预测的分类性能。此外，从神经成像设备中提取的特征与人口统计学、认知测试分数、CSF生物标志物和遗传数据相结合，也能有效实现准确分类。然而，非常需要在临床环境中验证这些标记物，以及在包含高度预先选择的受试者的数据库中验证它们，这与在临床上看到的显著不同。AD分类领域的研究人员面临着一些挑战，如原始神经影像数据维数高、样本量小、泛化性（普适性）、AD的异质性等，使其难以得出更精确的分类。然而，使用神经成像进行AD分类仍然是非常有前景的，因为前面提到的许多挑战都可以得到解决。临床实践中对分类框架的潜在考虑在很大程度上推动了机器学习工具的发展，这些工具可以整合几种成像特征，并在个体基础上做出预测。这研究方向很可能成为未来十年的焦点。此外，寻求在不同类型的图像上发现神经退变模式，形成AD各阶段的独特成像特征的多模态方法，以及通过结合多种分类算法的输出来改进分类的基于共识的方法，也得到了越来越多的关注。生物信息特征选择和AD异质性的表征也是未来研究中可能强调的重要研究方向。