在过去十年中,随着模式识别方法的增加和数据集大小的增加,医学图像分析领域的研究越来越多。这些研究促进了对图像定量特征高通量提取过程的发展,从而将图像转换为可挖掘数据特征,并随后对这些数据进行分析,以提供临床决策支持;这种做法被称为影像组学。这与将医学图像仅视为用于视觉解释的图片的传统做法形成了对比。影像组学特征包含一阶、二阶和高阶统计量。这些数据与其他患者数据相结合,并结合复杂的生物信息学方法进行挖掘,以开发能够提高诊断、预后和预测准确性的模型。由于影像组学分析旨在使用标准图像进行,因此将数字图像转换为可分析的数据最终将成为常规做法。本文描述了影像组学的流程、面临的挑战以及发挥更好的临床决策的潜在能力,尤其是在癌症患者的预后方面。本文发表在Radiology杂志。
通过高通量计算,现在可以从断层图像(计算机断层扫描[CT]、磁共振[MR]或正电子发射断层扫描[PET]图像)中快速提取大量定量特征。将数字医学图像转换为可挖掘的高维数据,这一过程被称为影像组学,其目的是通过定量图像分析,可以揭示生物医学图像包含反映潜在的病理生理学的信息。尽管影像组学是计算机辅助诊断和检测(CAD)系统的自然延伸,但它与计算机辅助诊断和检测(CAD)系统有着显著的不同。CAD系统通常是独立的系统,由食品和药物管理局指定用于检测或诊断疾病:(1). CAD的早期成功在乳腺癌成像方面最为显著。与CAD系统不同,CAD系统的目标是提供单一答案(即,是否存在病变或癌症),影像组学是一个明确的过程,旨在从数字图像中提取大量定量特征,将这些数据放入共享数据库,随后,挖掘数据以生成假设、进行检验或两者兼而有之。Radiomics旨在开发决策支持工具;因此,它涉及将影像数据与其他患者特征(如可用)相结合,以提高决策支持模型的能力。由于影像组学旨在从标准图像中提取最大信息,因此可以预见将数百万患者的大量影像组学数据(以及理想情况下的其他补充数据)结合起来的数据库的创建。
尽管影像组学可以应用于许多情况,但由于国家癌症研究所(NCI)定量成像网络(QIN)的支持以及NCI癌症成像项目的其他举措,影像组学在肿瘤学领域得到了最充分的发展。正如本文后续章节所述,随着知识和分析工具的发展,影像组学在肿瘤学决策支持方面的潜力也在增长。基于强度、形状、大小或体积以及纹理的定量图像特征提供了有关肿瘤表型和微环境的信息,这些信息不同于临床报告、实验室测试结果以及基因组或蛋白质组分析所提供的信息。这些特征,连同其他信息,可以与临床结果数据相关联,并用于临床决策支持(图1)。影像组学似乎提供了几乎无限的成像生物标记物,可能有助于癌症的检测、诊断和治疗,预后评估、治疗反应预测和疾病状态监测。
图1,流程图显示了影像组学过程以及在决策支持中的使用。
患者检查需要将来自不同来源的信息合并到一个连贯的模型中,以描述病变的位置、部位和作用。影像组学从获取高质量图像开始。从这些图像中,可以识别包含整个肿瘤或肿瘤内的子区域的感兴趣区域(ROI)。这些图像通过分割,最终以三维(3D)形式呈现。从这些感兴趣区中提取定量特征以生成特征,该特征与其他数据(如临床和基因组数据)一起放置在数据库中。然后对这些数据进行挖掘,为感兴趣的结果开发诊断、预测或预后模型。
挖掘影像数据以检测与基因组模式的相关性被称为影像基因组学,它在研究界引起了特别大的兴趣。为避免混淆,应注意,影像基因组学一词也用于影像肿瘤学领域,旨在基于全基因组分析来确定影像敏感性变异的遗传原因。此后,在本文中,我们将仅将影像基因组学称为影像特征与基因组数据的结合,以实现决策支持。影像基因组学的价值源于这样一个事实:尽管几乎所有癌症患者在治疗期间都会在某个时间点进行成像,而且往往是多次,但并不是所有患者都对其疾病进行了基因组分析。此外,当进行基因组分析时,固定位置进行,并且易受样本误差影响。因此,影像基因组学有两种潜在用途,将在影像基因组学结果部分的示例中详细描述。首先,影像数据的一个子集可以用来提示基因表达或突变状态,这可能需要进一步的检测。这一点很重要,因为影像数据来自整个肿瘤(或多个肿瘤),而不仅仅是样本。因此,影像组学可以提供有关样本基因组学的重要信息,并可用于交叉验证。其次,影像特征的一个子集与基因表达或突变数据没有显著相关性,因此有可能提供额外的独立信息。这一影像特征子集与基因组数据的结合可能会提高诊断、预后和预测能力。
虽然影像组学最初起源于基础研究,但最近它也引起了临床研究人员以及日常临床实践人员的兴趣。对于临床影像科医生来说,影像组学有可能帮助诊断常见和罕见的肿瘤。肿瘤异质性的可视化对于评估肿瘤的侵袭性和预后可能至关重要。例如,研究已经表明,影像组学分析有助于区分前列腺癌和良性前列腺组织,或增加有关前列腺癌侵袭性的信息。在肺癌和多形性胶质母细胞瘤的评估中,影像组学已被证明是评估患者预后的工具。为影像组学开发的工具可以帮助日常临床工作,而影像科医生可以在持续构建的用于未来决策支持的数据库方面发挥关键作用。
XX-组学是源于分子生物学学科的一个术语,用于描述生物分子的详细特征,如DNA(基因组学)、RNA(转录组学)、蛋白质(蛋白质组学)和代谢物(代谢组学)。现在,这个术语也被用于其他医学研究领域,这些领域从单个物体或样本中生成复杂的高维数据。组学数据的优势是这些数据是可挖掘的,因此可以用于探索和假设生成。组学概念很容易应用于多层定量断层成像:来自一名患者的一张多层面或三维图像可能很容易包含数百万个体素。此外,一个肿瘤(或其他异常实体)可能包含数百个描述大小、形状和纹理的可测量特征。影像组学分析是精确医学追求的缩影,在精确医学中,分子和其他生物标志物被用来预测在正确的时间对正确的患者进行正确的治疗。可靠且经过验证的生物标志物的可用性对于推进精准医学至关重要。全世界都在努力提高这类生物标志物的可用性,而在美国,这一努力最显著的是通过精准医学倡议。这项倡议将为一种新的以患者为动力的研究模式提供资金,该模式有望加速生物医学发现,并为临床医生提供新的工具、知识和疗法,从而实现更精确的个性化护理。
针对癌症的影像组学方法的一个主要优点是,几乎每一位癌症患者都能获得数字影像图像,所有这些图像都是潜在的治疗来源的影像组学数据集。仅在美国,每年就有大约160万新的癌症病例。大多数患者将接受多重CT、MR成像和PET检查。在未来,所有这些研究的图像解释都有可能通过使用影像组学来增强,从而建立一个前所未有的大数据源,扩大发现有用相关性的潜力。尽管影像组学将通过基因组学的新应用和改进的分型方法更好地描述患者及其疾病,但它也将增加数据管理的挑战,我们将在本文后面讨论。
影像组学为肿瘤生物学的评估提供了重要的优势。人们现在认识到,大多数临床相关实体瘤在表型、生理学和基因组水平(13-15)上具有高度异质性,并且它们会随着时间的推移不断进化。在这个靶向治疗的新兴时代,值得注意的是,大多数反应都不是持久的,而且效益通常是以月而不是年来衡量的。例如:(a)表皮生长因子受体突变型肺癌患者使用吉非替尼,(b)人类表皮生长因子受体2(或HER2)过度表达乳腺癌患者使用曲妥扎单抗,(c)b-Raf突变型黑色素瘤患者使用维穆拉非尼。同一患者肿瘤内和转移瘤部位的基因组异质性是治疗失败和出现治疗耐药性的主要原因。因此,精确医学不仅需要体外生物标记物和辅助诊断,而且还需要在空间和时间上分辨的肿瘤生物标记物。推动影像组学研究的一个核心假设是,影像组学有可能实现肿瘤内和肿瘤间异质性的定量测量。此外,影像组学提供了在治疗监测和优化或主动监测中纵向使用的可能性。尽管影像组学的此类应用尚待深入探索,但它们可能提供了最具价值的未来。
应该强调的是,影像和影像基因分析可用于确定相关性,而不是病理机制;因此,它们不能仅通过成像对组织的遗传或其他内容进行最终评估。然而,影像学数据与基因组或其他组学数据的相关性不仅可以决定是否检测活检样本中的某些基因改变,还可以决定活检部位的选择。它还可以提供证实性信息,以支持组织病理学发现。这一点很重要,因为据估计,癌症组织病理学的错误率可能高达23%。病理组织学中的错误是由于采样错误和观察者的可变性造成的;因此,非常需要额外的定量诊断信息。
我们相信,影像组学正在迅速超越最佳研究领域,并正在成为一种转化技术。因此,现在是开始建立数据提取、分析和建立标准的适当时机。本报告的目的是向包括影像科医生在内的广大临床医生介绍影像组学的实践,让更广泛的社区参与建立标准。在这样做的过程中,我们将描述影像组学技术所涉及的过程和它提供的独特信息,以及它所面临的挑战和潜在的解决方案。我们还将重点介绍一些最新的重要发现,最后为未来的影像组学提供展望。
影像组学流程
虽然从概念上讲很简单,但影像组学的实践涉及不连续的步骤,每个流程都有相对的挑战。这些步骤如图1所示,包括:(a)获取图像,(b)识别感兴趣的体积(即,可能包含预后价值的体积),(c)分割体积(即,用计算机辅助轮廓描绘体积的边界),(d)从体积中提取和确认描述性特征,(e)使用这些数据填充可搜索的数据库,以及(f)挖掘这些数据以构建分类器模型,单独或结合其他信息(如人口统计学、临床、共病或基因组数据)预测结果。我们将依次讨论这些过程。
图像获取
现代CT、MR成像和PET/CT组合使得在采集和图像重建协议方面有很大的差异,而医疗成像中心通常缺乏这些协议的标准化。在临床实践中使用的常规影像学特征的识别中,这通常不是问题。然而,当对图像进行数值分析以提取有意义的数据时,采集和图像重建参数的变化可能会导致非潜在生物效应引起的变化。这一点在新兴的定量成像领域得到了广泛认可,该领域的目的是生成具有可描述的偏差和方差限制的医学图像。换句话说,仅仅报告一个或一组从图像中提取的数字是不够的;相反,我们还必须能够提供误差标准,就像其他所有可靠的实验室测量一样。
在过去的15年里,为推进定量成像做出了多项努力,包括确定采集和重建标准(26,27)。QIN是NCI发起的一个合作网络,其目标是开发定量成像方法,以提高新癌症疗法临床试验的有效性。“QIN”是NCI的一项重大倡议,可以被视为新成像方法的前沿,包括影像组学。并且北美影像学会(RSNA)和美国国家生物医学成像和生物工程研究所(National Institute for Biomedical Imaging and Bioengineering)赞助了定量成像生物标记物联盟(QIBA),这是定量成像领域的一项重大努力(29)。QIBA的目标是通过将参与其开发和实施的所有团队聚集在一起,实现定量成像的标准化。QIBA的主要产品是一种新型文件,称为剖面图,该文件就特定用途的定量成像生物标记物的测量精度以及达到该测量精度水平所需的要求和程序达成共识。超过100名参与者参与创建了最初的齐巴氟脱氧葡萄糖PET/CT档案,该档案于2014年发布(30,31)。美国医学物理学家协会(American Association of Physicals in Medicine)正在以成像仪操作和测试的模式相关报告的形式提供定量成像的技术指南。最后,相关专业协会,如美国影像学会、RSNA、核医学和分子成像学会、国际医学磁共振学会和世界分子成像学会,正在越来越多地将定量成像基础的各个方面纳入其指南。
感兴趣区识别
确定具有预后价值的组织体积是肿瘤学影像学实践的核心。虽然在诊断时可以在一个或多个肿瘤部位检测到癌症,但大多数癌症转移患者都有多个病灶。在这两种情况下,我们都需要将肿瘤和疑似肿瘤确定为感兴趣的体积。然而,由于数字图像的空间和对比度限制,影像学报告中通常没有对可能具有预后价值的肿瘤内亚体积(肿瘤异质性的表现)进行详细分析。虽然异质性不包括在固体肿瘤1.1版(32)的反应评估标准中,但一些纹理描述符已被纳入更复杂的诊断成像报告和数据系统,如乳腺成像报告和数据系统(BI-RADS)(33)、前列腺成像报告和数据系统(PI-RADS)(34),以及肺成像报告和数据系统(Lung RADS)(35)。在影像组学的实践中,可以捕获所谓的感兴趣的子体积,并将其添加到分析中。在过程中其基本理念是在前端捕获尽可能多的数据,并使用数据库挖掘来识别具有最高预后价值的特征。
最近,使用图像数据识别病变在生理上不同区域的特征概念已经被发表(36)。在这种方法中,具有不同采集参数的图像(例如,对比T1WI磁共振成像、扩散加权和流体衰减序列)可以组合,以产生具有定量图像数据特定组合的区域。值得注意的是,当执行此操作时,组合位于肿瘤的空间明确区域(图2)。我们之所以称这些区域为感兴趣区,是因为它们在生理上代表不同的体积都有特定的血流、细胞密度、坏死和水肿组合。可以从每个感兴趣区提取额外的影像特征,以获得癌症病变的高粒度描述。例如,在多形性胶质母细胞瘤患者中,这些感兴趣区的分布可以使我们区分进展迅速的癌症(存活400天)和更缓慢的癌症(37)。此外,这些感兴趣区在治疗后发生变化(例如,用放疗和替马唑胺治疗),观察到的变化模式可以预测反应。
图2:多形性胶质母细胞瘤患者。
通过结合平扫和对比增强T1加权、T2加权和液体衰减反转恢复(FLAIR)图像来确定感兴趣区。通过直方图分析,将每次采集的数据分为低值和高值,得出八种不同组合的可能性。实际上,只观察到四种不同的组合。它们对应于红色(低T1、高T2和FLAIR)、黄色(低T1和T2、高FLAIR)、蓝色(高T1和FLAIR、低T2)和绿色(高T1、低FLAIR和T2)区域。值得注意的是,虽然单个体素是通过数学确定的,但它们在空间上聚集成连续区域,反映不同的生理微环境。
分割
分割是影像组学中最关键、最具挑战性和最具争议的部分。这一点至关重要,因为后续的特征数据是从分割的体积生成的。这很有挑战性,因为许多肿瘤边界模糊。这是一个有争议的问题,因为关于是否寻求基本原理或再现性,以及在多大程度上依赖手动或自动分割,目前仍存在争论。然而,一个共识正在形成,通过计算机辅助边缘检测,然后进行手动处理,可以实现最佳的可重复分割。众所周知,手动轮廓肿瘤的变异性很高(38,39)。正常结构的分割,如骨骼元素和器官,现在可以实现完全自动化。然而,任何疾病,尤其是癌症,都需要医生诊断输入,因为在初始检查时受试者之间和受试者内部的形态学和对比度具有异质性。
特征选择和量化
影像组学的核心是提取高维特征数据,以定量描述感兴趣区的属性。实际上,“语义”和“潜在”特征是影像组学中提取的两种类型的特征。语义特征是影像学词汇中常用于描述感兴趣区域的特征,而不可知特征是那些试图通过定量描述来捕捉病变异质性的特征。
语义特征-虽然影像科医生通常使用语义特征来描述病变,但在本文中,我们使用计算机辅助对其进行量化。基于语义特征具有预后价值,影像组学的早期研究开发了影像学词汇,与BI-RAD、PI-RAD和Lung-RAD的描述非常相似。Segal等人在这方面发表了一篇权威的文章,他在影像基因组学的早期例子中,使用了一系列有限的影像科医生评分的定量特征来预测肝细胞癌的基因表达模式(40)。这种方法仍然具有很高的价值,并且有一种趋势,即在计算机的帮助下捕获此类语义数据,以实现更高的组间一致性、更快的诊断量和更小的差异。
潜在特征-图像上的不可知影像特征是通过数学方法提取的定量描述符,通常不属于影像科医生的词汇。这些可分为第一、第二或更高阶的统计输出。一阶统计量描述单个体素值的分布,而不考虑空间关系。这些通常是基于直方图的方法,并将感兴趣的区域减少为图像上强度的平均值、中值、最大值、最小值、均匀性或随机性(熵),以及直方图的偏度(不对称)和峰度(平坦度)的单个值。二阶统计描述符通常被描述为“纹理”特征;它们描述了具有相似(或不同)对比度值的体素之间的统计相互关系。1973年,Haralick等人首次引入图像纹理分析(41)。在影像组学中,纹理分析可以很容易地提供肿瘤内异质性的测量。在实践中,有几十种方法和多个变量可用于提取纹理特征,导致数百个值太多,无法在本文中详细阐述。本文参考了一些关于该研究的优秀综述,特别是关于肿瘤内异质性的综述。高阶统计方法对图像施加过滤,以提取重复或非重复特征。这些包括分形分析,其中滤波被施加在图像上,并且包含指定值的体素的计算(44);Minkowski泛函,用于评估强度高于阈值的体素特征;小波,是将图像乘以复杂线性或径向“波”矩阵的滤波变换;高斯带通滤波器的拉普拉斯变换,可以从图像中提取纹理图案越来越粗糙的区域。
人们一直在努力识别、定义和提取更多的潜在特征。第一个这样的研究使用182个纹理特征和22个语义特征来描述肺癌的CT图像。然后是442个组合的特征集,其中也包含小波。最近,这已经扩展到662个特征,其中还包含高斯拟合的拉普拉斯变换;以及522个特征的组合,其中包括纹理和分形维数特征。这些特征可能可以从个体感兴趣区中提取,从而产生数千个数据元素来描述每个感兴趣的体积,每个患者都有许多感兴趣的体积。
因此,很明显,描述图像特征的数量可以接近通过基因表达谱获得的数据的复杂性,这通常会产生超过30000个不同序列的信息。如此复杂的情况下,存在过度拟合分析的危险,因此,必须通过优先考虑主要特征来降低维度。最系统的方法是首先确定可能是冗余的特征(即那些彼此高度相关的特征)。图3是从143例非小细胞肺癌患者的CT扫描中提取的219个特征的协方差矩阵。那些彼此高度相关(R2.0.95)的特征显示为红色非独角区域。高度相关的特征簇可以折叠成一个具有代表性的特征,通常是主体间可变性最大或动态范围最高的特征。图3还为其他组学领域提供了一个概念桥梁,其中图像的数据内容由假彩色图表示。如果可用,复测数据也非常有用,因为它们可以帮助根据特征的再现性确定特征的优先级。Aerts等人描述的另一个优先级别是,在代表不同潜在和语义特征类别(例如大小、形状和一阶二阶高阶特征)的单独类别中对顺序特征进行排序。然后,可以使用每个类中的两个或三个最高优先级的特征构建分类器模型。归根结底,特征集的价值取决于它们对通过数据库挖掘创建的分类器模型的贡献。
图3:特征的协方差矩阵。
共从235名患者的每个非小细胞肺癌肿瘤中提取了219个特征。在所有肿瘤中,通过使用回归分析将每个特征与所有其他特征单独比较,从而产生相关系数(R2)。然后沿着两个轴对各个特征进行聚类和绘制,R2显示为热图,高相关性区域(R2.0.95)显示为红色。因此,对角线上的每个红色方块都包含一组相互高度相关的特征,因此是冗余的。为了进行数据分析,选择了一个特征来代表这些群体。选择的代表性特征是在整个患者数据集中具有显著(患者间变异性)的特征,明确假设显示最高患者间变异性的特征将是信息量最大的特征。
建立数据库:保证数量和质量
在影像组学和其他领域,预测分类器模型的能力取决于是否有足够的数据。根据我们的经验,合理的经验法则是,基于二元分类器的模型中的每个特征需要10个样本(患者数据)。此外,最好的模型是那些能够容纳额外的临床或基因组协变量的模型,这增加了对大型高质量数据集的需求。尽管更大的数据集提供了更大的准确率,但仅需100名患者就可以进行影像成像。从回顾性数据中获取和整理大型高质量数据集非常耗时。例如,在最近的一项研究中,我们整理了一组具有基因表达谱的非小细胞肺癌腺癌患者的数据。在当地数据库中,285名此类患者很容易被确定为此类队列研究的潜在候选者。需要通过图表和病理学检查来验证这些结果需要188小时,由于数据缺失或组织病理学发现不明确,导致研究队列中失去了50名患者。当组织病理学发现模棱两可时,病理学家检查了图像;这只会增加时间。通过标准化的图像采集和重建系统,需要92小时的标准化图像采集。将特征分割和提取到数据库中需要额外145小时。因此,143名患者的数据集的研究需要285名患者(约50%的损耗)的训练集,需要430小时的处理,或每个患者大约3小时的处理。因为这些患者没有进行医疗或人口统计筛选。在未来,以更高的质量和标准前瞻性地捕获图像和其他数据将减少数据消耗,并使过程更高效。
建模
一旦有了高质量和精心策划的大型数据集,它们就可以用于数据挖掘,即在大型数据集中构建模型的过程。这个过程可以使用人工智能、机器学习或统计方法。一方面,这些方法包括有监督和无监督机器学习方法,如神经网络、支持向量机或贝叶斯网络。尽管这些方法通过训练集使用先验知识,但它们是不可知的,因为它们不对单个特征的含义进行假设。因此,在开始学习时,所有特征都被同等重视。数据挖掘领域的另一端是假设驱动的方法,它们根据预定义的信息内容对特征进行聚类。虽然这两种方法都有优点,但最好的模型是那些根据特定医学背景量身定制的,因此从定义明确的终点开始。
理想情况下,稳健的模型能够适应实验以外的患者特征。协变量包括基因组图谱(表达、突变、多态性)、组织学、血清标记物、病史和符合特定用例的生物标记物(图1)。实际上,并非所有患者都能获得所有信息;因此,模型的设计也应该适应稀疏数据。如前所述,模型的鲁棒性完全取决于数据库中数据的大小和质量。质量不仅取决于图像采集条件,还取决于协变量的可用性和可靠性。例如,总体存活率是许多研究的共同终点,但这包括所有原因的死亡,这可能与正在研究的疾病无关。相对准确的研究终点包括无进展生存和无疾病生存或复发;然而,这些数据并不容易获得,需要通过图表审查进行专门的抽象工作。因此,迫切需要获取此类数据,并在各机构之间共享数据,以积累足够的数据,增强统计能力。这种数据共享是秦的一项重大举措,QIN的成员致力于将精心策划的数据集存入癌症成像档案库,用于公共和私人数据挖掘工作。
影像组学结果举例
在过去10年中,影像组学和影像基因组学在断层成像(CT、MR成像和PET)方面的研究显著增加。两篇写得很好且相对较新的评论描述了2014年的一些进展(42,43)。在接下来的部分中,我们将重点介绍一些显著的发现,其中一些是最近的,这些发现显示了影像组学在多个领域实质性地帮助临床护理的潜力。
辅助诊断
在一项对147名经活检证实患有前列腺癌的男性进行的研究中,Wibmer等人表明,Haralick纹理分析有可能在T2加权MR图像和扩散加权MR图像得出的表观扩散系数(ADC)图上区分癌性前列腺组织和非癌性前列腺组织(图4)。在前列腺周围区域,评估的所有五个特征(熵、惯性、能量、相关性和同质性)在两种类型的图像上的良性组织和癌组织之间存在显著差异;然而,在过渡区,ADC图上的所有五个特征和T2加权图像上的两个特征(惯性和相关性)都存在显著差异。在后续研究中,这些特征被用于自动计算Gleason分级,并被发现能够区分Gleason评分为6(3+3)的癌症和Gleason评分为7或以上的癌症,准确率为93%。此外,这些分析可用于区分两种不同形式的Gleason评分7疾病(4+3 vs 3+4),准确率为92%。
图4:纹理分析在前列腺癌T2加权MR图像和ADC图中的应用。
过渡区的病变在T2加权图像(左上)上几乎看不见,在ADC图(右上)上具有更高的显著性。纹理特征是基于每个体素从手动分割的感兴趣区域计算出来的,识别正常周边区域(蓝色轮廓)和癌症(红色轮廓)。根据计算出的纹理特征,采用机器学习方法来区分正常结构和癌性结构,并对格里森模式进行分级。热图图像显示了健康组织和癌症之间的明显差异,描绘了肿瘤内的异质性,这可能有助于评估肿瘤的侵袭性,并为融合磁共振成像-超声活检提供信息。
肿瘤预后
遗传学研究首次显示了癌症患者的定量图像特征与基因表达模式之间的关系。在第一项研究中,研究人员将从肝细胞癌患者对比增强CT图像中提取的影像科医生定义的语义特征与使用机器学习和神经网络的基因表达模式进行了比较。他们发现,28种成像特征的组合可用于重建78%的整体基因表达谱,而这些基因表达谱又与细胞增殖、肝脏合成功能和患者预后有关。在随后的一项研究中,研究人员采用类似的方法,比较了从MR图像中提取的图像特征,以预测多形性胶质母细胞瘤患者的整体基因表达模式。他们发现,“浸润性”成像表型与显著缩短的生存期相关。
肺癌患者中,有确凿的证据表明肺部CT图像上存在肿瘤内异质性。这些异质性可以通过纹理或熵梯度等特征来捕捉。Grove等人发现,这些指标是早期肺癌患者强有力的预后指标(P,.01)。Aerts等人的一项研究表明,影像特征可用于预测来自两个独立机构的完全独立肺癌患者队列的结果。此外,同样的特征也可以应用于具有同等预后能力的头颈癌患者队列。值得注意的是,该特征由来自四个类别(大小、形状、纹理和小波)的顶级特征组成,这些特征通过使用测试-再测试再现性和主体间范围从442个特征的数据库中进行优先排序。这项研究展示影像组学从一般影像学表型在识别多种癌症预后方面的潜力。
影像学界众所周知,磁共振成像的对比度增强通常是不均匀的,具有复杂的模式。在一篇具有里程碑意义的文章中,Rose等人分析了23例胶质瘤患者的动态对比增强MR图像的增强模态,使用二阶和更高的统计指标来表示增强异质性。他们表明,动态对比增强MR图像的纹理异质性的复杂度量转移系数图可用于区分高级别和低级别胶质瘤,其统计功效(P,.00005)远高于单独的中值转移系数图(P=.005)。在最近的一项研究中,Gevaert等人提取了55例接受基因表达谱分析的胶质瘤患者的大量语义和潜在特征。然后对特征集进行重复性筛选,产生18个特征,并在三个不同的感兴趣区进行评估。在潜在特征中,大部分与语义特征相关;54人中有3人与生存有关,7例与基因表达有关。当通过通路评估基因表达时,大约一半的成像特征显示出与基因组学的强相关性。这些分析表明,基于影像组学的方法可以显著提高预测基因表达模式、预后和胶质瘤分期的能力。
最近,Vignati等人对49例前列腺癌患者的扩散和T2加权磁共振成像检查进行了彻底的前瞻性影像组学分析。将从T2加权图像和ADC图中提取的潜在特征与更传统的ADC截止指标进行比较,以验证纹理有助于区分病理性Gleason评分为6的男性和病理性Gleason评分为7或更高的男性的假设。这是一个重要的临界点,因为病理学Gleason评分为6分的男性可能是积极监测的候选对象。对于标准ADC截止指标,AUC特性曲线下的面积范围为0.82至0.85。当分析ADC和T2图的异质性时,曲线下的面积分别提高到0.92和0.96。尽管这项研究可能数据量不足,但它显示了定量分析肿瘤异质性在评估肿瘤侵袭性和告知重大临床决策(如是否治疗癌症)方面的潜在价值。值得注意的是,其他研究人员也发现,即使在控制了ADC中位数后从ADC图确定的熵与病理性Gleason评分显著相关。
治疗选择
在一项开创性研究中,Kuo等人确定了与阿霉素药物反应基因表达程序相关的肝细胞癌影像学表型。他们的结果表明,影像基因分析可用于指导个体肿瘤的治疗选择。最近,一项对58名接受局部晚期乳腺癌治疗的女性的研究表明,纹理分析动态对比增强磁共振成像可以帮助预测新辅助化疗开始前的反应。
指导活检或切除
图像可以用来指导活检是不言而喻的。我们认为,对区域不同的影像特征进行定量分析也可以准确地确定活检;也就是说,它们可以用于先验地识别复杂肿瘤中最可能包含重要诊断、预后或预测信息的位置。使用PET将功能信息叠加在CT或MR图像上,以更好地指导腹部和骨病患者的活检,已经证明了这一点。图4、图6和图7分别显示了影像组学在前列腺癌、膀胱癌和转移性乳腺癌患者的MR成像、CT和PET/CT中应用的最新实例,并显示了影像组学在更明智地决定在哪里进行活检方面的潜力。
影像组学挑战
在这篇文章中,我们已经讨论了影像医学过程中各个步骤的技术挑战。现在,我们将介绍从整体上看,从影像组学引起的更广泛关注。
再现性
影像组学是一门新兴的学科。与以分子生物学为动机的治疗一样,影像组学在加速精确医学方面具有巨大潜力。然而,影像组学也有可能经历与基于分子生物学的系统诊断技术和治疗相同的缓慢进展。这一缓慢进展可归因于多种原因,包括技术复杂性、糟糕的研究设计(尤其是假设生成与假设检验的混合)和数据拟合过度,缺乏验证结果的标准,结果报告不完整,所用数据库中未识别的混杂变量,尤其是如果数据是回顾性得出的。因此,与任何生物标志物研究一样,回顾性影像组学研究必须根据完全独立的数据集进行验证,最好是来自另一个机构。此外,最严格的生物标志物鉴定要求进行前瞻性多中心试验,其中生物标志物是主要终点之一。
虽然已经开发出了用于基因组分析的标准化工具(前列腺癌的GenomeDx[GenomeDx Biosciences,加利福尼亚州圣地亚哥]、乳腺癌的Oncotype Dx[genomic Health,加利福尼亚州红杉城]),但它们并没有得到普遍认可,也没有在各个医疗中心得到应用,这阻碍了数据共享和结果重现的发展。研究已经在生物医学研究和分子靶向药物开发中记录了这些问题。2009年对生物医学研究报告的分析发现,至少50%的研究太差、不够充分或不完整,无法使用。拜耳医疗保健公司(德国勒沃库森)的科学家报告称,他们仅能成功复制的67项研究中四分之一的已发表结果。此外,当安进(加利福尼亚州千橡园)的科学家试图复制癌症基础科学中53项里程碑式的研究时,他们只复制了6项(67项)的原始结果。这些问题已经变得足够严重,来自30多家高影响因子生物医学期刊的编辑已经联合起来,实施统计测试的共同标准,并改善原始数据的获取。这些标准已被美国国立卫生研究院采用。尽管这些标准是为解决临床前数据而制定的,但它们可以应用于所有研究领域,并可以为解决与影像组学固有的高维数据采集和分析相关的复杂问题提供标准参考。Equator network提供了一个极好的概述,该网络促进了健康研究的质量和透明度。医学研究所2012年的《组学》报告也指出了研究设计的挑战。解决这些挑战的一个明确办法是为影像组学研究的开展及其在文献中的报告建立基准。
大数据
在精确医学时代,每个患者都会收集到千兆字节的数据。患者数量的指数增长以及从中获取的数据元素被通俗地称为“大数据”。大数据倡议的目的是从并非源自精心控制的实验的大数据集中得出推论。虽然观测值之间的相关性可能数量庞大且容易获得,但因果关系更难评估和建立,部分原因是它对于复杂系统来说是一个模糊且缺乏明确规定的结构。在大数据学科中,有一些基本问题:获取海量数据是否是理解基础科学和应用科学基本问题的关键?或者,数据的大量增加是否会混淆分析,产生计算瓶颈,并降低得出有效因果推断的能力?与影像组学技术一样,大数据领域也处于早期阶段。上述问题在美国国家科学院(National Academy of Sciences,71)主办的一次大数据会议上得到了解决,影像医学领域将从这一努力中受益。
数据共享
建立基于影像组学的模型作为用于决策支持的生物标记物的最大挑战是在多个地点共享图像数据和元数据。多站点试验需要询问不同的患者队列,并创建足够大的数据库进行统计分析。数据共享是所有生物医学研究的共同挑战,必须克服文化、行政、监管问题。值得注意的是,像儿童肿瘤学小组这样的社区已经建立了数据共享的历史和文化,因此可以扩大他们的研究,包括影像图像分析。影像组学中的数据共享尤其令人望而生畏,因为共享数据必须包括图像,并且共享必须符合《健康保险便携性和责任法案》,因为构建足够复杂的模型需要大量个人健康信息。应对这一挑战的解决方案有很多,可以包括:
(a)大型集中数据存储库,如癌症成像档案馆和癌症基因组图谱,其中的访问权限仅限于机构审查委员会——批准的用户或数据可以被剥夺个人健康信息;
(b) 联合方法1,其中每个机构维护各自的数据,并发送查询模型以提取相关元数据;
(c)联合方法2,其中所有机构都可以由诚实的经纪人访问(即,拥有多站点机构审查委员会批准访问权限的超级用户)。无论采用哪种解决方案,基础设施成本都可能是巨大的。
标准
虽然在本文中已经提到的许多领域已经存在或正在制定标准,但仍然存在差距。例如,尽管重新测试受试者或患者研究的价值得到了广泛认可,但许多已发表的研究样本量较小。理想情况下,这些研究应该结合起来进行meta分析;然而,如前所述,报告结果的方式往往存在问题。虽然有报告指南,但还没有定量成像结果的报告指南,更不用说更复杂的影像组学结果的报告了。纹理分析核心技术的测试也缺乏标准。如果该领域要实现其潜力,就有必要为影像组学的各个方面提供标准。
影像组学:临床决策的下一个前沿
我们对影像组学的愿景是乐观而明确的。在可预见的未来,我们预计从世界各地的影像学检查中收集的数据将转化为定量特征数据,这些数据将与知识库连接,以提高诊断准确性和决策支持的预测能力。为了使其在临床环境中具有较高的外显率,必须鼓励从业者参与这一过程。我们怎么从这里到那里?显然,解决方案的一部分涉及解决上述标准化和数据共享的挑战。此外,必须前瞻性地收集数据。影像科医生在前端识别和管理数据以及在用户端应用分类器模型以提高诊断和预后准确性方面发挥着核心和关键作用。在此期间,这将是一项涉及信息技术专家、生物信息学家、统计学家和治疗医师的多学科工作。在这里,我们概述了需要在短期和中期内在地方和跨国层面上做些什么。
影像科医生对高质量数据的管理
在当前的一般实践中,影像学检查是定性评估的,生成的报告通常不使用标准词汇,尽管有许多研究采用统一的词汇,如RadLex®。(如果经常使用,带有RadLex®类型图像功能的注释可能会大大有助于挖掘数据库。此外,图像一旦存档,就很少再被访问。尽管存在大量图像存储库,但由于前面所述的限制,它们实际上无法进行管理。解决方案是在站点前瞻性地捕获数据。因此,我们设想从经典影像学过渡到影像科医生积极参与定量图像数据库管理的新范式。高质量图像数据的收集需要复杂的内容专业知识来识别、限定(在计算机协助下)和注释(使用标准化和可挖掘的词典)感兴趣的内容。为了实现高质量的数据整理,我们必须首先让影像从业者相信它的价值,我们必须简化流程,使其能够在临床实践的限制范围内实现。通过在大数据的数据整理和分析中发挥关键作用,影像科医生和内科医生都将能够使影像学成为其领域中一个重要、有价值的新维度。
健康信息
为了获得最大价值,在个体患者的检查和监测过程中获得的各种高质量数据必须相互连接。这是众所周知的,大多数大型医疗中心现在都在投资合适的电子病历系统,以便以可挖掘的形式访问患者数据。目前,影像数据通常不作为该数据流的一部分纳入;然而,随着结构化影像报告的采用,这种情况正在发生变化。未来的挑战将是捕获影像数据,作为结构化报告的一部分。
数据共享
如前所述,分类器模型的质量受到用于创建它们的数据集大小的限制。即使一个机构能够前瞻性地获取其所有影像数据,也需要数年时间才能产生足够的数量。此外,这些数据是一个移动的目标,因为医学图像采集技术在不断改进。图像采集和重建中的差异是必须纳入定量图像数据挖掘中的协变量,因此会增加按数量级排列的建模所需的数据量。解决方案是让多机构、国家或国际财团同意通过集中或分布式(联合)网络共享数据。这些挑战已经在基因表达、测序和蛋白质结构数据库的基础科学中得到了解决。通过共享肿瘤学元数据(http://www.oriencancer.org或儿童肿瘤学小组)开始解决这些问题,癌症成像档案馆(Cancer Imaging Archive,77)已经启用了一些图像文件共享。迄今为止,开发定量图像驱动的生物标记物的合作效果非常显著。影像组学在进一步丰富图像解释、扩大成像范围、提高精确度和提取活体生物信息方面具有巨大潜力。为了充分发挥影像医学的潜力,我们需要接受跨学科的共同愿景,并做出共同承诺。
未来的影像科阅片室
上述场景需要一个阅览室,在这里,执业影像科医生与图片存档和通信系统软件交互,以识别、分割和提取感兴趣区域的特征。如果在同一患者身上获得的先前研究可用,阅读软件将自动识别先前的感兴趣区域。作为读取的一部分,提取的大小、形状、位置和纹理特征将自动上传到共享数据库,并通过算法与之前的图像进行比较,以实现更精确的诊断。由于大多数图片存档和通信系统都能够将当前图像与以前的图像共同配准,并执行用户交互分割,因此这些功能几乎就在眼前。在可预见的未来,影像组学研究领域将集中于改进分类器模型,以提供最准确的诊断,从而改善患者护理和结果。