人工智能在癌症和精准医学领域的研究

目录

介绍

卷积神经网络:图像分类的主力军

从其他大型数据集生成预测模型

数据质量和模型选择是关键

癌症的早期检测、诊断和分期

使癌症诊断更准确

癌症分期和分级

在早期癌症检测的道路上

使用机器学习检测癌症突变

充分利用突变

确定来源的肿瘤细胞

表征肿瘤微环境

治疗靶点和药物的发现

药物设计

药物再利用

患者预后和对治疗的反应

预测药物疗效和协同作用

当前的挑战和未来的前景


人工智能 (AI) 正在迅速重塑癌症研究和个性化临床护理。高维数据集的可用性加上高性能计算的进步以及创新的深度学习架构,导致人工智能在肿瘤学研究的各个方面的使用呈爆炸式增长。这些应用范围从癌症的检测和分类,到肿瘤及其微环境的分子表征,到药物发现和再利用,再到预测患者的治疗结果。随着这些进展开始渗透到临床,我们预见癌症护理的转变范式将受到人工智能的强烈推动。

意义:

人工智能有可能极大地影响肿瘤学的几乎所有方面——从增强诊断到个性化治疗和发现新的抗癌药物。在这里,我们回顾了人工智能在肿瘤学中的应用最近取得的巨大进展,强调了局限性和陷阱,并为在癌症临床中采用人工智能绘制了一条路径。

介绍

“人工智能”(AI)一词最早是在 1956 年为达特茅斯夏季研讨会创造的,当时它被广泛称为“思考机器”。简单来说,人工智能可以定义为机器从足够有代表性的例子中学习和识别模式和关系的能力,并有效地利用这些信息对看不见的数据做出决策。人工智能是一个涵盖机器学习和深度学习(有时与机器学习同义词使用)的广泛术语。从广义上讲,机器学习是人工智能的一个子领域,而深度学习是机器学习的子集,专注于深度人工神经网络(即具有多个全连接隐藏层的人工神经网络;图 1)。近年来,深度学习因其在人脸识别和图像分类等计算机视觉任务中的空前成功而获得了巨大的关注(1)。深度学习的这一特性将其适用于癌症研究和医学的各个方面,例如从染色的肿瘤切片或放射学图像中自动准确地检测癌症,从而有可能减轻病理学家和放射科医生的日常和重复性任务的负担。

图1。

AI、机器学习和深度学习之间的关系,以常用算法为例。CART、分类和回归树;LASSO,最小绝对收缩和选择算子;SVM,支持向量机。

卷积神经网络:图像分类的主力军

卷积神经网络 (CNN) 是用于癌症图像分类的最流行的深度学习架构(图 1 ))。CNN 将一系列非线性变换应用于结构化数据(例如图像的原始像素)以自动学习相关特征,这与经常需要手动特征管理的传统机器学习模型不同。另一方面,很难说出 CNN 学习了哪些特征,这使得它们成为许多人所说的“黑匣子”。结果之一是用于 CNN 的图像应该经过仔细的预处理,以降低模型从图像伪影中学习的风险。CNN 模型有两种主要方法;一种是迁移学习,它使用来自大量自然对象(例如 ImageNet)的图像来训练模型的初始层(模型学习识别形状和边缘等一般特征),然后使用特定疾病数据来微调最后一层的训练参数。CNN 的第二个变体基于自动编码器,其中模型从代表性图像的子集学习背景特征,并对稍后用于初始化 CNN 的基本特征的压缩表示进行编码。在 CAMELYON16 挑战赛中——一项众包竞赛,旨在从苏木精和伊红 (H&E) 染色肿瘤的全幻灯片图像 (WSI) 中识别和分类乳腺癌患者的淋巴结转移——提交的 32 个算法中有 25 个是 CNN,2 )。Khosravi 及其同事训练并测试了几种最先进的深度学习模型,以从癌症基因组图谱 (TCGA) 队列的 H&E 染色肿瘤组织中分类 WSI,并报告了这些方法的相对性能,并指出迁移学习——基于 inception 的架构(GoogLeNet V1 和 V3)在肿瘤-正常组织和癌症亚型分类任务中具有整体最佳性能 ( 3 )。

从其他大型数据集生成预测模型

在过去的十年中,一些国家和国际倡议导致了大型癌症数据集的产生。这些数据集是从使用各种高通量平台和技术分析肿瘤样本中获得的。它们经常用于构建预测模型,为研究提供信息,并最终为临床决策提供信息(图 2A)。TCGA 是迄今为止最全面的公开可用的肿瘤概况汇编,包括大量数据类型,涵盖基因组学、表观基因组学、蛋白质组学、组织病理学和放射学图像 ( 4)。全基因组泛癌分析 (PCAWG)、METABRIC 和 GENIE 等其他工作也汇编了大量癌症基因组图谱,并将这些数据公开。分析技术随着时间的推移而发展。例如,基因组 DNA 分析已经从靶向 panel 扩展到整个外显子组,再到整个基因组。基因表达谱已经从全基因组微阵列发展到 RNA 测序 (RNA-seq),然后发展到更精细的单细胞 RNA-seq (scRNA-seq)。其他成熟的技术已经产生了范围广泛的数据集,包括 DNA 甲基化谱、大规模蛋白质组学研究、扰动研究,包括使用小分子的细胞活力或细胞毒性测定、RNAi 或 CRISPR 筛选、蛋白质-蛋白质相互作用网络, 和更多。公开可用或可以在最短时间内生成的数据集的广泛性和多样性为集成各种数据类型提供了独特的机会。许多团体已经展示了这种整合的好处。例如,Cheerla 和 Gevaert 等人已经证明,在多个集成而不是单一数据源上训练预测模型可以提高对癌症患者总体生存率的预测。5)。Madhukar 及其同事使用这种综合方法来预测抗癌小分子的靶标和作用机制,并清楚地证明了整合多种数据类型可以提高预测准确性 ( 6 )。

图 2。

机器学习基础概述。A,用于 AI 模型的患者衍生数据集,旨在加速从实验室到床边的癌症护理。B,机器学习分类器工作流程中的基础步骤。AUPRC,精确召回曲线下的面积;AUROC,受试者工作特征曲线下面积;DL,深度学习。

数据质量和模型选择是关键

机器学习工作流的基本策略是相当标准的(图 2B)。数据收集和清理是任何工作流程的首要和关键组成部分,因为模型与其训练的数据一样好。为了确保收集到的数据的高质量,需要检查和纠正非图像(例如不准确的数据条目和缺失值)和图像(例如来自伪影和不均匀照明的高强度像素)数据中可能存在的噪声类型。还需要审查数据以找出可能导致模型欠拟合的偏差或可能导致模型过拟合的高方差。当模型从数据中的伪影或噪声而不是真实信号中学习时,它会过度拟合数据。过度拟合的后果是模型可能无法很好地泛化到具有不同偏差的未见数据。诸如交叉验证、增加训练集大小等策略,

机器学习工作流程的另一个关键步骤是根据其性能选择和微调最佳模型。机器学习模型的性能通常使用接收器操作特征曲线 (AUROC; 或简称 AUC) 下的面积来衡量,它量化了灵敏度和特异性之间的权衡。一个好的分类器应该同时实现高灵敏度和高特异性,但强调它们中的任何一个对于某些应用程序可能很重要。一般来说,AUC > 0.80 被认为是好的,但这个阈值是否也是临床可接受的可能因临床使用而异。即使被广泛使用,盲目地依赖 AUC 作为性能指标也存在缺陷。例如,AUC 评估总体中的模型性能,但不提供对单个调用的置信度。对于具有类不平衡的数据集,即正类(感兴趣的类)示例远少于负类示例,模型的重点是准确检测正类,精确召回曲线下的区域(AUPRC)是 AUC 的首选替代方案。在给定队列上训练和测试模型后(通常分为训练集和测试集),同样重要的是还要在外部独立数据集上验证模型,以确保模型稳定且泛化良好。AI模型开发不是一个静态的过程;随着更新的数据集可用,模型需要不时进行测试。经常需要进行例行维护,以确保模型性能不会因概念漂移而降低,即

在这篇综述中,我们试图调查广泛的出版物和研究,这些出版物和研究共同捕捉了人工智能应用于肿瘤学的广度和多功能性。我们试图描述的模型范围从在临床中具有预期用途的模型到推动研究和发现的模型(图 3)。这篇评论不仅特别强调了深度学习作为一种制作机器学习模型的技术,而且还涵盖了传统机器学习技术得到非常有效使用的用例。最后,我们强调了将 AI 模型集成到临床中的局限性和挑战。

图 3。

人工智能在癌症研究和精准医学中的应用。ADMET、吸收、分布、代谢、排泄和毒性。

癌症的早期检测、诊断和分期

癌症检测的时机、癌症诊断的准确性和分期是肿瘤侵袭性的关键决定因素,并影响临床决策和结果。在短短几年内,人工智能为这一关键的肿瘤学领域做出了重大贡献,有时其性能可与人类专家相媲美,并具有可扩展性和自动化的额外优势。

使癌症诊断更准确

直接从组织病理学和其他医学图像中准确诊断癌症和识别癌症亚型的基于深度学习的模型已被广泛报道。深度神经网络 (DNN) 是强大的算法,具有适当的计算能力,可以应用于大型图像,例如来自活检或手术切除的组织的 H&E 染色 WSI。这些模型架构确实在图像分类方面表现出色,例如确定数字化染色载玻片是否包含癌细胞(2、3、7-13)。DNN 在区分肿瘤和健康细胞方面达到最高预测准确度(AUC > 0.99),同时也用于更具挑战性的分类任务,例如区分密切相关的癌症亚型(例如胃癌和结肠癌中的腺癌与腺癌以及腺癌)与肺肿瘤中的鳞状细胞癌)并检测良性与恶性组织。例如,Coudray 及其同事开发并应用了 DeepPATH,这是一种基于 Inception-v3 架构的模型,同时将 TCGA 肺癌队列的 WSI 分类为三个类别中的任何一个——正常、肺腺癌和肺鳞状细胞癌。报告的 AUC 为 0.97 ( 11 )。

DNN 的成功不仅限于组织病理学图像,还扩展到通过 CT 扫描、MRI 和乳房 X 线照片等非侵入性技术获取的其他医学图像,甚至是可疑病变的照片。例如,Esteva 及其同事在皮肤病变图像上训练了一个 DNN(Inception-V3 架构),这些图像标记为 757 个颗粒性皮肤病类别(14)。他们的模型在对皮肤病变的摄影和皮肤镜图像进行癌症和黑色素瘤分类测试时,其表现优于 21 名获得董事会认证的皮肤科医生的平均准确度(AUC,0.91-0.94)。重要的是,他们的模型对数码照片固有的可变性(由于不同的相机角度、不均匀的曝光等)具有鲁棒性,因此使该模型的适用性非常通用(14)。在放射学方面,Anthimopoulos 及其同事表明,肺部疾病患者的 CT 扫描可用于构建 DNN,以平均准确度为 0.85 ( 15 ) 对肺部的纹理模式(例如毛玻璃混浊和微结节)进行分类。同样,Jiang 及其同事使用 CT 扫描开发了 DNN,该 DNN 预测胃癌的隐匿性腹膜转移,与临床和病理特征相比,AUC 有所改善(0.92-0.94)(AUC,0.51-0.63;参考文献16)。在另一项工作中,Wang 及其同事使用来自 172 名前列腺癌患者的 MRI 图像来训练和测试可以区分前列腺癌和良性前列腺疾病(例如前列腺肿大)的 DNN(使用伯克利 AI 研究的 Caffe 深度学习框架开发)报告的 AUC 为 0.84 ( 17 )。在一项活检确诊和纵向随访的回顾性研究中,McKinney 及其同事发表了一种集成方法,该方法采用三个独立的深度学习模型,直接从大约 29,000 名女性的乳房 X 线照片中预测癌症风险评分(AUC,0.75-0.88;参考文献 10)。18)。该小组还报告说,与普通放射科医师相比,乳房 X 线照片检测癌症的绝对特异性 (1.2%-5.7%) 和敏感性 (2.7%-9.4%) 有所提高。总而言之,如果这些模型的性能在前瞻性研究中得到证实,它们可能在癌症的早期检测和分类中发挥重要作用,特别是因为它们的性能与该领域的专家相当,甚至更好。在医院环境之外,人工智能辅助的智能手机应用程序也已开始被采用,有可能将癌症病变的早期检测直接带到用户的手持设备上 ( 19, 20)。无论多么方便和有前途,这种智能手机应用的诊断准确性仍有待临床验证。特别值得关注的是被预测为假阴性的病例,因为它们可能会延迟患者获得及时的医疗护理(19)。

癌症分期和分级

癌症分期和分级,即确定癌症的侵袭性和进展程度,是诊断过程的另一个重要组成部分。分期确实会影响治疗选择,例如在观察等待和涉及放疗、手术和化疗的积极治疗之间做出决定。在前列腺癌中,使用 Gleason 评分来实现分期,这是两种评分的组合,用于测量载玻片上两个不同位置的肿瘤细胞的患病率。DNN 在从前列腺肿瘤的组织病理学图像中预测 Gleason 评分方面显示出有希望的初步结果 ( 21, 22 )。Nagpal 及其同事使用 WSI 对 H&E 染色的前列腺切除术标本进行训练和测试 DNN (Inception-V3) 和基于 k 近邻分类器的模型来预测 Gleason 评分 ( 21)。该小组报告说,与由 29 名独立病理学家组成的小组(0.61)相比,根据他们的模型估计的 Gleason 评分的预测准确性(0.70)有所提高。癌症分期也可以从放射学图像中完成:Zhou 及其同事开发了一种深度学习方法(基于 SENet 和 DenseNet)从肝癌患者的 MRI 图像中预测等级(低与高),并报告 AUC 为 0.83 ( 22)。总体而言,这些研究表明人工智能在癌症分期中的应用前景广阔,尽管 AUC 适中,但据报道其表现与训练有素的专家相当。

基因组图谱等非成像数据也越来越多地用于诊断和分期。从下一代测序 (NGS) 获得的数据——例如全外显子组、全基因组和靶向 panel;来自微阵列、RNA-seq 和 miRNA 的转录谱;和甲基化谱——可用于诊断癌症并将肿瘤分类为亚型。因为这些平台提供的数据是高度多维的(可以同时评估数万个基因),它们用于癌症分类需要统计方法或机器学习(23-25)。事实上,早在 2000 年代初,机器学习就已经在分子数据中用于癌症诊断和分期,当时机器学习方法(如聚类、支持向量机和人工神经网络)被应用于基于微阵列的癌症分类表达谱和亚型检测(26)。多年来,组学技术不断进步,机器学习算法的创新也在不断发展。Capper 及其同事证明,专门针对肿瘤 DNA 甲基化谱进行训练的随机森林分类器可以显着提高中枢神经系统癌症难以诊断亚类的预测准确度(AUC,0.99;参考文献27)。他们对 139 例病例的亚类预测与病理学家的诊断不符,但对这些选定病例的随访显示,模型实际上准确预测了大约 93% 的不匹配病例 ( 27 )。转向深度学习方法,Sun 及其同事构建了 DNN 并将其应用于基因组点突变,以将组织分类为 12 种 TCGA 癌症类型或从 1000 基因组计划中获得的健康组织 ( 28)。该分类器在从全外显子组测序图谱中获得的最常见的癌症特异性点突变上进行训练,能够以高精度(AUC,0.94)区分健康组织和肿瘤组织,但在多类分类任务中表现不佳同时区分所有 12 种癌症类型(AUC,0.70)。这项工作强调了使用突变数据进行准确的癌症分类具有挑战性,这可能是因为肿瘤内异质性和肿瘤纯度低(使突变检测具有挑战性),以及不同癌症类型之间存在共享突变。尽管如此,这项工作还表明,使用基因组信息评估癌症的类似模型可以应用于从其他来源获得的基因组图谱,例如无细胞 DNA (cfDNA)。

在早期癌症检测的道路上

AI 也逐渐为通过新兴的微创技术(例如循环肿瘤 DNA (ctDNA) 或 cfDNA 的液体活检)早期检测癌症铺平道路。通过微创技术(如简单的血液检测)获得的液体活检理论上可以早期发现癌症、监测随时间推移的复发风险并指导治疗方案。例如,可以从子宫内膜癌患者的 ctDNA 预测微卫星不稳定性 (MSI) 状态,以便为基于免疫治疗的治疗提供信息 ( 29 )。Chabon 及其同事开发了一种基于机器学习的方法 Lung-CLiP(血浆中的癌症可能性),它可以预测肺癌患者血液中 ctDNA 的可能性(30)。该方法首先估计 cfDNA 突变与肿瘤相关的概率(使用弹性网络模型和包括 cfDNA 片段大小的特征),然后将该模型的输出与具有五种不同算法的集成分类器中的拷贝数分数集成预测血液样本中 ctDNA 的存在。该方法显示出适度的预测性能(AUC,0.69-0.98),其性能取决于癌症阶段,以及预测的特异性和敏感性之间的权衡。在另一项有前途的工作中,Mouliere 及其同事报告了一种基于随机森林的分类器,该分类器对来自 cfDNA 片段大小的特征进行训练,该分类器可以高精度地预测多种癌症类型血液中 ctDNA 的存在(AUC,0.91-0.99;参考文献31)。作为癌症的完整端到端血液检测,Cohen 及其同事针对八种不同的癌症类型开发了 CancerSEEK,它不仅可以检测早期癌症,还可以直接从 ctDNA 预测八种癌症类型中的任何一种 ( 32 )。首先通过逻辑回归模型将样本分类为癌症阳性,该模型应用于 16 个基因的突变和 8 个血浆蛋白的表达水平。然后使用随机森林分类器预测癌症类型(准确度范围为 39% 至 84%,具体取决于癌症类型;参考文献32)。这项工作特别重要,因为该测试涵盖的八种癌症类型中有五种目前没有可用的早期筛查测试。总而言之,人工智能在早期癌症检测领域的初步进展是显着的,但迄今为止仅限于传统的机器学习算法。随着液体活检数据采集的扩展,我们预计更先进的深度学习架构将消除手动选择和管理大多数相关歧视性特征的需要。我们还预计将进一步使用结合多种数据类型(例如液体活检和成像)的多模式方法(例如 CancerSEEK),以加强早期检测并随着时间的推移监测疾病风险。

使用机器学习检测癌症突变

NGS 的普遍可用性使成千上万的癌症实验室能够对癌症基因、外显子组和基因组进行常规测序。可以使用各种计算工具来识别 NGS 数据中的遗传变异和突变,但在某些情况下经常会失败,例如低覆盖率或基因组的复杂、重复丰富的区域。几个小组已经探索了将突变检测重新定义为机器学习问题的想法(33、34)。例如,DeepVariant 是一种基于 DNN(Inception-V2 架构)的方法,它通过首先生成候选变体的读取堆积图像(从而使其成为图像分类任务)然后预测概率来从对齐的 NGS 读取中检测变异它们的基因型可能性状态(纯合参考、杂合变体或纯合变体;参考文献33)。该方法在第二届 PrecisionFDA Truth Challenge (2016) 中获得了 SNP 检测最佳性能奖。

充分利用突变

AI 感兴趣的另一个领域是直接从组织病理学图像中检测某些关键突变,尤其是临床上可操作的突变,这些突变可作为靶向治疗的反应生物标志物(例如激活EGFR突变)。这将为来自 NGS 的突变检测提供一种具有成本效益和更快的替代方案,因为它将利用来自病理学和放射学的无处不在的图像数据。DeepPATH 除了对 TCGA 肺癌的亚型进行分类外,还能够直接WSI 59 AUC 范围在 0.73 和 0.85 之间的患者 ( 11)。结果很有希望,但仍然需要了解 DNN 模型正在学习哪些特征来确定每张幻灯片的突变状态。该小组还测试了他们的模型以检测独立肺癌队列中的EGFR突变,并获得了 0.687 的较低 AUC。他们将这种较低的 AUC 归因于独立队列和 TCGA 队列(他们的模型在其上进行了训练和验证)之间的测序平台和组织保存技术的差异。在这项工作之后,其他小组也应用人工智能方法来识别图像中的突变。例如,基于迁移学习的 DNN 方法可以直接从 844 例 AUC > 0.81 的肺腺癌患者的术前 CT 扫描中确定EGFR突变状态。35 )。使用 SResCNN 模型的18 F-FDG-PET/CT 扫描也直接确定了非小细胞肺癌肿瘤中的EGFR突变状态,AUC > 0.81 ( 36 )。驱动突变(例如,IDH1)和 MGMT 甲基化状态可以在弥漫性低级别神经胶质瘤中检测到,使用 MRI 图像进行特征提取,然后使用 AUC > 0.70 的 XGBoost 模型(37)。DNN (Inception-V3) 可以使用 AUC > 0.71 ( 38 ) 直接从 WSI识别肝癌中的常见突变(CTNNB1、FMN2、TP53ZFX4)。

对体细胞突变的关注已从评估单个基因的突变扩大到评估突变足迹,即在肿瘤内发现的所有突变的数量和背景。MSI 状态是肿瘤中突变足迹的一个例子,它已作为检查点免疫疗法的诊断和预测生物标志物发挥了重要作用 ( 39 )。例如,FDA 最近批准 Keytruda(pembrolizumab)作为 MSI 高(MSI-H)转移性结直肠肿瘤患者的一线治疗药物(https://www.fda.gov/news-events/press-announcements /fda-批准-一线-免疫疗法-患者-msi-hdmmr-转移性结直肠癌)。这促使人们寻找可以轻松检测 MSI-H 肿瘤的快速且具有成本效益的方法。和以前一样,一个令人信服的想法是直接从 H&E 染色的组织病理学图像预测 MSI 状态,这些图像很容易获得并且不需要额外的组织;这将为现有方法提供具有成本效益和时间敏感性的替代方案,例如来自 qPCR、免疫组织化学 (IHC) 或 NGS 的 MSI 推断。考虑到这一目标,Kather 及其同事应用 ResNet18 CNN 首先检测 H&E 载玻片中的肿瘤区域(AUC > 0.99),然后将它们分类为 MSI 或微卫星稳定。该方法应用于 1,600 例 TCGA 肿瘤,主要集中在胃癌、结直肠癌和子宫内膜癌(40)。模型性能与癌症相关,AUC 范围在 0.75 到 0.84 之间。有趣的是,与速冻载玻片(AUC,0.77)相比,福尔马林固定、石蜡包埋(FFPE)载玻片的分析与更好的预测准确度(AUC = 0.84)相关。在外部结直肠癌队列中的验证在准确性方面具有可比性(AUC,0.84)。有趣的是,他们的方法在具有不同种族(亚洲, n = 185)的个体的不同胃癌队列中表现不如用于训练模型的个体(TCGA-STAD 主要是非亚洲;AUC,0.69 ; 参考文献40)。在最近的工作中,Yashmita 及其同事训练和测试了 MSINet,这是一种基于 MobileNetV2 架构的迁移学习模型,用于对组织进行分类,并随后在来自 100 个原发性肿瘤的结直肠癌队列中的 H&E 染色组织病理学切片(放大倍数为 40 倍)中对 MSI 状态进行分类来自斯坦福医学中心 ( 41 )。该小组报告的 AUC 为 0.93,这是对先前报告的 ResNet18 模型的一个很好的改进 ( 40, 41 )。Yashmita 及其同事通过两种方式将他们的模型与之前发布的 ResNet18 模型进行了比较:(i) 他们在其内部队列 ( n = 100) 上重新训练了 ResNet18 模型并将其应用于 TCGA-CRC 队列 ( n= 479):这里他们显示 ResNet 的 AUC 为 0.71,而他们的模型 MSINet 的 AUC 为 0.77(或仅在 40 倍放大时的 AUC 为 0.83),或者(2)他们重新训练了他们的模型 MSINet Kather 及其同事使用的训练集并将其应用于他们的内部数据集(n = 100):在这里,他们报告他们的模型的 AUC 为 0.88,而 ResNet18 模型的 AUC 为 0.77(41)。与 ResNet18 模型相比,他们的两种比较策略都显示 MSINet 的性能有所提高,而 TCGA 队列的 AUC 普遍较低可能是由于 TCGA 数据集的高异质性,这些数据集是从多个机构收集的。

肿瘤突变负荷 (TMB) 是检查点免疫治疗反应的另一个重要生物标志物 ( 42 )。通常使用 NGS 进行估计,因此成本高且跨平台和基因组 ( 43 ) 的可变性高,直接从组织病理学切片进行估计也正在成为一个活跃的研究领域。作为直接从 WSI 确定 TMB 的第一次尝试,Jain 及其同事报告了一种基于 Inception-v3 架构的深度学习模型 Image2TMB,以确定肺腺癌 (LUAD) 中冷冻 H&E 载玻片的 TMB 状态(高与低) TCGA 队列(n = 499;参考文献44)。该模型在三个放大倍数(5×、10× 和 20× 放大倍数)下进行了训练和测试,并且使用随机森林模型聚合了三个放大倍数的 TMB 状态概率,以预测 TMB 是否高于或低于其预定义的 TMB (AUC,0.92)。在另一项工作中,Wang 及其同事还尝试从 TCGA 的胃肠道队列的 FFPE 载玻片中对 TMB 状态进行分类(n = 545;参考文献45)。与 Jain 及其同事一样,该小组也依赖于根据整个外显子组的非同义突变计数计算的 TMB,并使用上三分位数作为定义高 TMB 的截止值。该小组比较了八种不同的迁移学习模型,并报告 GoogLeNet 是他们治疗胃肿瘤的最佳模型(AUC,0.75),VGG-19 是他们治疗结肠肿瘤的最佳模型(AUC,0.82)。除了组织病理学图像,CT 扫描也被用于预测非小细胞肺癌的 TMB(AUC,0.81;参考文献46)。与 TMB 相关,研究人员现在正在寻求直接从组织病理学载玻片预测染色体不稳定性,这是已知的癌症进化驱动因素 ( 47 )。

确定来源的肿瘤细胞

在临床上,确定肿瘤起源的细胞可以为特定部位的治疗提供信息,据报道,这些治疗比全身化疗更有效 ( 48 )。这与原发部位未知的肿瘤或从液体活检获得的 cfDNA 相关。不同的肿瘤类型具有不同的体细胞突变模式,这些模式可以用来识别肿瘤的起源组织。传统上,起源组织是使用包括 IHC 和基因表达谱分析在内的方法确定的,但这些方法的准确度估计约为 80%,需要进一步改进 ( 49)。作为替代方案,Jiao 和他的同事作为 PCAWG 联盟的一部分,构建并应用了基于多类 DNN 的模型,对从 28 种癌症类型(包括原发性和转移性肿瘤)的大约 6,000 个肿瘤的全基因组获得的合并突变计数(50)。该方法背后的基本思想是,区域突变计数代表了基因组区域的染色质可及性,因此可以概括起源细胞的表观遗传状态。具体来说,他们表明,整个基因组中每个 Mb bin 的体细胞突变的区域分布(其中大部分是乘客突变)可以准确地预测起源组织(总体准确度为 0.83-0.91;准确度因肿瘤类型而异)。有趣的是,没有发现驱动基因或通路的存在是该模型中有用的分类特征。

总之,本节讨论的方法突出了人工智能检测癌症突变的日益增长的潜力。尽管此类方法可能不足以准确地替代分子病理学评估,但它们可能有助于阐明与突变相关的细胞机制,并可能有助于筛选大量患者和肿瘤中可能具有特定突变谱的亚型。这反过来可能有助于设计临床试验和确定可能从特定靶向治疗中受益的群体。我们预计未来将开发更多的补充方法。例如,人工智能可能越来越多地用于帮助理解突变的功能影响,例如预测非编码突变对基因表达、表观遗传过程以及疾病风险的影响 ( 51, 52)。在未来几年,我们还预计从组织病理学图像中检测突变可能会获得进一步的临床相关性。例如,可以直接从纵向肿瘤标本收集的病理图像中的组织学模式变化预测对治疗的抗性、突变状态的变化,以及广义上的肿瘤演变(53-54)。

表征肿瘤微环境

尽管预测性能一直很高,但数字病理学中使用的许多 AI 方法可以被描述为“黑匣子”;也就是说,可以教授人工智能方法来区分不同类型的疾病,但通常不能提供分类过程背后的易于解释的解释。这与训练有素的病理学家使用的过程不同,后者使用有据可查的图像和细胞形态特征以及数十年的培训来评估组织。人工智能有可能帮助自动化该过程并简化病理学家可能相对耗时的日常任务,例如估计组织中肿瘤细胞的数量或从其组织形态确定给定标本的起源细胞。肿瘤细胞性,即样本中肿瘤细胞的比例,是治疗后残留病灶(病理反应)的重要指标。在更实际的层面上,肿瘤细胞结构估计还有助于病理学家选择合适的组织块进行进一步分析,例如基因组测序。传统上,病理学家检查染色的组织切片以确定肿瘤细胞结构,这种方法不仅费力,而且由于观察者内部和观察者间的变异性而具有高度的主观性。肿瘤细胞性也可以从 NGS 数据集进行计算推断,但可用推断方法之间的一致性有限,并且严重依赖于大量基因组改变的存在以获得足够的准确性。肿瘤细胞性估计还有助于病理学家选择合适的组织块进行进一步分析,例如基因组测序。传统上,病理学家检查染色的组织切片以确定肿瘤细胞结构,这种方法不仅费力,而且由于观察者内部和观察者间的变异性而具有高度的主观性。肿瘤细胞性也可以从 NGS 数据集进行计算推断,但可用推断方法之间的一致性有限,并且严重依赖于大量基因组改变的存在以获得足够的准确性。肿瘤细胞性估计还有助于病理学家选择合适的组织块进行进一步分析,例如基因组测序。传统上,病理学家检查染色的组织切片以确定肿瘤细胞结构,这种方法不仅费力,而且由于观察者内部和观察者间的变异性而具有高度的主观性。肿瘤细胞性也可以从 NGS 数据集进行计算推断,但可用推断方法之间的一致性有限,并且严重依赖于大量基因组改变的存在以获得足够的准确性。55 )。为了使用 AI 方法解决此任务,Akbar 及其同事旨在使用 DNN(InceptionNet 架构)直接从 53 名乳腺癌患者的 H&E 染色 WSI(20 倍放大倍数)中量化肿瘤细胞,从而无需细胞核分割和分类,和特征提取(56)。该小组训练了两个 DNN 模型,一个用于区分肿瘤与健康组织,另一个用于输出指示肿瘤细胞性的回归分数(介于 0% 和 100% 之间)。他们的预测分数与两位独立病理学家报告的肿瘤细胞结构有很好的一致性(相关性 0.82;参考文献56)。尽管这些初步发现证明了直接从 WSI 量化肿瘤细胞结构的可行性,但这些模型需要在更大的数据集上进行训练和测试。

进一步扩展肿瘤纯度分析,人工智能方法被用于肿瘤微环境(TME)的空间和定量评估。肿瘤细胞不断与其微环境中的其他细胞相互作用,例如免疫细胞和基质细胞,这些相互作用部分决定了肿瘤如何进化、转移或对治疗作出反应(57)。因此,TME 的表征对于研究这些机制很重要。这种表征对于了解检查点免疫疗法背景下的肿瘤免疫串扰尤其重要。Saltz 及其同事证明了使用具有卷积自动编码器的 DNN 直接从针对 13 种 TCGA 癌症类型获得的 H&E 染色组织病理学载玻片识别和量化淋巴细胞浸润的可行性,其中自动编码器学习基本形态特征(如细胞核和淋巴细胞)的紧凑表示) 从病理学幻灯片中提取并使用它来初始化神经网络以进行训练 ( 58)。该小组训练了两个 DNN,一个用于对给定图像中每个补丁的肿瘤浸润淋巴细胞 (TIL) 状态进行分类,另一个用于识别载玻片上的坏死区域以减少误报。这些补丁后来被病理学家汇总并手动检查,以改进模型输出。然后量化载玻片中 TIL 阳性与 TIL 阴性斑块的比例。使用病理学评估的肺肿瘤贴片 (LUAD) 的一个子集作为金标准,他们报告的 AUC 为 0.95。在另一项工作中,Bejnordi 及其同事在 882 名患者的乳房活检组织病理学图像上训练和测试了 DNN(VGG-Net 架构),以区分良性和恶性组织,并以 92% 的准确度对正常与肿瘤相关基质进行分类(59)。最近,Fassler 及其同事利用从胰腺癌组织的多重 IHC 获得的组织病理学图像,并应用了由自动​​编码器 (ColorAE) 和 U-Net CNN 组成的 DNN ( 60 )。细胞分割和分类性能范围从 0.40 到 0.84(表示为 F1 分数,AUC 的替代方案)。未来,能够以快速增加的分辨率对 TME 的多个方面进行成像的多路复用成像平台(如 Vectra PerkinElmer 和成像质谱流式细胞仪)将越来越多地使用,以及更深层次的网络架构(如 GoogLeNet 和 Inception-V3)等强大的图形处理单元。这些技术将使研究人员能够详细研究 TME 内复杂的细胞间相互作用。

除了使用组织病理学切片来确定 TME 的组成外,DNN 还被用于根据从 scRNA-seq 配置文件获得的数据,将批量 RNA-seq 或微阵列配置文件解卷积为常驻或浸润细胞类型的库。这些方法,包括 Scanden 和 DigitalDLSorter ( 61, 62 ),功能强大但用途有限,因为目前只有一小部分组织类型的单细胞图谱是公开的。尽管如此,这些差距正在得到解决,从使用更高通量的 scRNA-seq 解决方案(如 10× Chromium)到协调全球倡议,如旨在全面分析人体每种细胞类型的人类细胞图谱(63) .

专注于改善 TME 中单个细胞类型(尤其是上述免疫细胞)量化的研究正在引起人们的兴趣,这主要是由于临床检查点免疫疗法的成功。事实上,TME 在启动抗肿瘤免疫反应方面发挥着重要作用,特别是当免疫细胞已经被免疫原性肿瘤相关新抗原引发时。新抗原是由肿瘤特异性突变事件(非同义突变、截断突变、新基因融合和交替剪接)产生的突变肽,并被患者的免疫系统识别为非自身。新抗原因其在接受检查点免疫疗法治疗的患者中驱动异常反应中的作用及其在过继性 T 细胞疗法和个性化肽疫苗中的潜在用途而被广泛研究。57 )。作为标准做法,从外显子组或基因组测序中检测到的突变被收集并在计算机上翻译成相应的突变肽。然后通过预测这些突变肽与患者的 MHC I 类等位基因的结合亲和力来推断新抗原。NetMHC 是最早和最先进的新抗原预测工具之一,它基于人工神经网络。在其他现有的 MHC-肽结合预测工具中,大多数仍然基于人工神经网络(MHCflurry 和 EDGE),而一些较新的方法已经扩展到其他模型,例如随机森林 (ForestMHC)、更高级的 AI 算法例如自然语言处理(NLP;HLA-CNN)或 CNN(ConvMHC 和 DeepSeqPan),有时直接从免疫沉淀测定或质谱法(MS;参考文献 57、64)中的原始数据训练)。随着新抗原临床使用的趋势转向更加个性化的方法,例如使用个性化肽疫苗,Tran 及其同事开发了一种针对患者的方法,其中 NLP 模型在患者的野生型免疫肽组上进行训练,然后应用于患者的突变免疫肽组以预测可能的新抗原的从头肽序列 ( 65)。该模型需要更广泛的验证,因为它仅在五名黑色素瘤患者身上进行了训练和测试。尽管如此,该小组提出了一种高度个性化且令人兴奋的方法,可以直接从患者的 MS 数据中预测 HLA 结合的新抗原序列,而无需依赖 NGS 进行突变或 MHC 等位基因预测。这些预测的新抗原,通过这种方法和上述其他方法,是否真正具有免疫原性仍需要进行实验测试。

治疗靶点和药物的发现

药物发现和开发通常与成本和时间负担的增加有关。对各种 NGS 和成像技术的负担得起的访问,以及越来越多的大型癌症数据集(公共或私人)的可用性,导致人们对利用人工智能提高这一过程的效率产生了爆炸性的兴趣。这包括开发集成不同数据集的模型,以解决药物发现范围内的每个组成部分(图 4)。例如,Tong 及其同事将临床数据与基因表达谱和蛋白质-蛋白质相互作用网络相结合,以推导出使用一类支持向量机预测肝癌候选药物靶点的特征(AUC,0.88;参考文献66)。在基于乳腺癌特定深度学习的分类方法中,López-Cortés 及其同事整合了许多癌症数据库,如 PharmGKB、Cancer Genome Interpreter 和 TCGA 等,以预测与乳腺癌发病机制相关的蛋白质,并报告了几个可行的候选者追求作为生物标志物或药物靶点 ( 4, 67–70 )。DepMap 联盟已经为研究人员提供了数百个功能丧失屏幕数据集,这些数据集能够实施各种 AI 策略 ( 71 )。例如,ECLIPSE 机器学习方法通​​过利用基因特异性和细胞系特异性数据,基于 DepMap 数据预测癌症特异性药物靶点(72)。同样,Chen 及其同事从 DepMap 数据中检查了广泛的分子特征,发现蛋白质组学数据(特别是反相蛋白质阵列数据)高度预测癌细胞系依赖性(73)。这一发现强调了人工智能的多功能性,不仅可以预测治疗目标,还可以评估与预测模型最相关的实验数据类型。

图 4。

整合来自多个不同来源的数据集,从测序到结构再到筛选数据集,可以增加人工智能模型的相关特征空间,从而实现端到端的药物发现。

药物设计

人工智能还被应用于设计具有所需物理化学性质和靶标特异性的计算机药物结构。传统的 AI 技术专注于二元分类,难以对复杂目标建模,例如在计算机上生成新分子。强化学习是 AI 的一个不断增长的子集,非常适合解决复杂目标问题并允许交互式反馈,已在计算机分子生成中大量使用 ( 74-76 )。Olivecrona 及其同事展示了他们的循环神经网络方法,使用基于策略的强化学习进行调整,能够生成塞来昔布的类似物和不含硫元素的化合物(74)。您和同事介绍了一种图卷积网络方法,该方法使用强化学习生成新分子,在针对特定属性进行优化或创建具有某些属性的类似物时显示出高精度 ( 76 )。图卷积网络的使用尤其影响和改进了分子生成,因为它可以更好地模拟化学分子,并且不需要将分子计算转换为它们的二维表示。此外,生成对抗网络(GAN)是两个网络(生成器和判别器)的组合,用于构建更强大的生成器模型,也已普遍应用于分子生成任务(77、78))。MolGAN 是一种生成具有特定特性的分子的方法,它同时使用了 GAN 和强化学习架构,并在各种特性方面实现了高性能,包括药物可能性、可合成性和溶解度(分别为 62%、95% 和 89%;参考文献78)。尽管基于神经网络的模型在这一分子生成领域占主导地位,但基于非神经网络的模型在预测药物特性方面已经取得成功(79-81)。Gayvert 及其同事发表了一个随机森林模型,该模型使用不同的临床前数据类型来预测药物毒性和不良事件(79)。Shen 及其同事训练了一个支持向量机模型来预测药物的各种吸收、分布、代谢和排泄特性,并通过准确预测血脑屏障通透性和人体肠道吸收来验证他们的方法 ( 81 )。

药物再利用

药物再利用——在现有医学适应症之外为“旧”药物寻找新的治疗用途——为传统药物发现提供了一种快速、安全和经济的替代方案。基于网络的集成细胞特征库 (LINCS) 等新举措已经发布了丰富的转录数据集(如基因扰动图谱),人工智能可以利用这些数据集来加速药物再利用工作(82)。LINCS 数据集和其他数据集已被用于从可以逆转癌症特异性基因特征表达谱的药物中识别再利用候选者(通过比较癌细胞与正常细胞的表达获得;参考文献83-85)。在来自 LINCS 的药物干扰转录谱上训练的 DNN 也被用于预测药物的治疗用途类别(例如,血管扩张剂、抗肿瘤药),并通过它们与已批准的抗癌药物的化学结构相似性来优先考虑再利用候选药物 ( 86 )。除了转录谱外,从细胞活力测定(测量用特定分子处理后代谢活跃细胞的数量)获得的公开数据集也已用于训练 AI 模型 [癌症药物敏感性基因组学 (GDSC),PRISM 、NCI-60等;参考文献。87–89]。CDRScan 是在 GDSC 和 COSMIC 细胞系项目 (CCLP) 的细胞活力数据集上训练的五个基于 CNN 的模型的集合,它根据患者的个体体细胞突变谱预测 GDSC 中的哪种药物对患者最有效 ( 90 ) . 除了针对癌症的再利用工作外,还有许多其他与疾病无关的药物再利用方法可以扩展到癌症(91-93)。DeepDR 是一种基于变分自动编码器的 DNN 模型,基于已知的临床注释和药物的化学结构来预测新的药物-疾病联系 ( 92 )。同样,Gottlieb 及其同事创建了 PREDICT,一种计算管道,以基于整合药物和疾病相似性来预测药物的新适应症。93 )。PREDICT 确定了许多已知疗法的新适应症,包括使用黄体酮治疗一种罕见的肾细胞癌,这一关联在文献中得到了支持。重新利用候选者的识别是人工智能研究的一个活跃领域,到目前为止,已经产生了许多有前景的模型和重新利用预测。

患者预后和对治疗的反应

前瞻性地识别与特定疗法最匹配的患者的能力有助于降低不良临床结果的风险,也有助于降低高昂的治疗成本,平均每年可高达 150,000 美元。这对于检查点抑制剂免疫疗法尤其重要,在这种疗法中,总体良好的反应率较低(约 20%),但某些患者表现出特殊的长期临床益处。由于数据可用性不足,人工智能在该领域的使用受到限制,但现在正在逐渐扩大。Liu 及其同事报告了一种基于逻辑回归的分类器,该分类器针对未经治疗的基因组和转录组学特征和临床特征进行训练,以预测晚期黑色素瘤患者对 PD-1 抑制剂的耐药性(AUC,0.73-0.83;参考文献94)。Litchfield 及其同事从已发表的检查点抑制剂研究中汇编了迄今为止最大的匹配基因组和转录组谱,并使用该数据集训练和测试基于 XGBoost 的癌症特异性分类器,以预测对检查点免疫疗法的反应(AUC,0.66-0.86;参考文献95)。Johannet 及其同事报告了一种更先进的 AI 方法,该方法使用在未经治疗的组织病理学切片上训练和测试的 CNN 以及患者的临床特征来预测晚期黑色素瘤患者对检查点免疫治疗的反应(AUC,0.80;参考文献96)。

除了免疫疗法外,还广泛报道了通过组学或图像数据预测患者对其他癌症治疗反应的模型。Sun 及其同事将 DNN 应用于从乳腺癌患者(来自 METABRIC 和 TCGA)的基因表达、拷贝数改变和临床特征中提取的特征,以预测患者在接受各种适应症治疗后的预后(AUC > 0.80;参考文献97)。使用 DNN 的类似基于组学的方法已被证明可以根据脑癌中的基因表达和通路谱预测患者存活率,并根据肝癌中的基因表达、miRNA 表达和甲基化谱预测患者存活率 ( 98, 99)。关于基于图像的模型,Korfiatis 及其同事将 DNN(ResNet 架构)模型应用于脑肿瘤的术前 MRI 扫描,以预测MGMT基因的甲基化状态(这是手术或治疗后患者预后的既定生物标志物);ResNet50 模型在验证集中显示出良好的预测性能(F1 分数 = 0.95–0.97;参考文献100)。CNN 也已应用于术前或治疗前 CT 扫描,以预测肺癌患者的无病生存期 ( 101, 102)。在另一项工作中,Mobadersany 及其同事训练了一个带有最后一层 Cox 回归模型的 CNN,以直接从脑肿瘤的组织病理学切片预测患者风险(中位数 c 指数 = 0.75),并且在包含基因组标记后,他们的模型的性能进一步提高(异柠檬酸脱氢酶突变状态和 1p/19q 共缺失)在 CNN 中(中位数 c 指数 = 0.801;参考文献103)。同样,Bychkov 及其同事应用 CNN 来预测接受手术的结直肠癌患者的 H&E 染色组织病理学切片的组织贴片图像的存活率(预测患者分层的 HR,2.3;AUC,0.69)。令人惊讶的是,该模型的表现优于三位人类专家提供的共识评估(HR,1.67;AUC,0.58;参考文献104)。Skrede 及其同事将 CNN(MobileNetV2 架构)应用于切除肿瘤的 H&E 染色 WSI,以直接预测早期结直肠癌对化疗和/或放疗(或无)的患者预后(AUC,0.71);基于模型预测分层的患者组之间的多变量生存分析表明,与预测良好预后的患者相比,预测预后不良的患者确实具有较差的癌症特异性生存率(调整后的 HR,3.04)(105)。

早期确定正在进行的治疗是否对患者无效以及临床医生是否需要及时转换或改变治疗过程也很重要。在临床环境中,通过手动检查病理学或放射学图像来监测癌症进展和对治疗的反应,以量化肿瘤缩小并检查新病变的出现。然而,这种手动评估可能具有挑战性,特别是对于疾病进展模式可能不典型的检查点抑制剂免疫疗法 ( 106 )。为此,Dercle 及其同事展示了使用机器学习来训练具有治疗特异性特征的模型以预测对不同癌症治疗的反应的可能性(107)。该小组使用六种机器学习算法的集合来预测患者对化疗、靶向治疗和免疫治疗的敏感性(定义为高于人群中位数的无进展生存期),使用从非小细胞患者的纵向 CT 扫描中提取的定量特征肺癌(AUC 分别为 0.67、0.82 和 0.77;参考文献107)。在另一项工作中,Choi 及其同事应用 CNN 来预测晚期乳腺癌患者对新辅助化疗的反应,从 PET/MRI 扫描对初治和化疗治疗的肿瘤进行预测。据报道,他们的模型的预测性能(AUC,0.60-0.98)优于某些传统的反应预测方法(例如治疗前后连续 CT 扫描量化的标准化摄取量的差异;参考文献108)。在一个更集中的时间序列模型中,Xu 及其同事使用 CNN 和循环神经网络应用于肺部肿瘤的纵向 CT 扫描,以预测放化疗后患者的总体存活率(AUC,0.74;分层患者 HR,6.16;参考文献109)。除了监测患者对治疗的反应外,CURATE.AI 等机器学习模型现在提供了额外的途径,可以使用随时间收集的患者特定数据点以动态方式调整单个患者或联合治疗的药物剂量 ( 110 )。

预测药物疗效和协同作用

更广泛地说,机器学习算法已被应用于基于分子特征预测药物疗效。由于大型癌症药物疗效数据集的可用性,这项工作变得越来越重要,这些数据集是从细胞系中进行的实验中获得的 ( 87, 89, 111, 112 )。尽管由于遗传漂移或交叉污染,细胞系是不完美的模型(113),但它们为 AI 模型提供了大量可供学习的数据。与所有数据集一样,通常需要执行预处理以最小化潜在噪声,例如细胞系认证或体内数据的验证 ( 114 )。在一项研究中,Iorio 及其同事测量了 1,001 个癌细胞系对 265 种不同抗癌化合物的反应(115)。基于这些结果,他们构建了一系列 Elastic Net 模型,将突变和基因表达值等基因组特征转化为药物疗效(以 IC 50值的形式)。这些模型能够准确地预测疗效。由于其准确性和可解释性,随机森林是一种常用的药物反应预测方法,与其他机器学习方法相比,它已被证明可以提高整体准确性(116)。除了传统的机器学习,深度学习也正在成为药物反应预测的广泛使用选择。利用来自 TCGA 和癌细胞系百科全书的数据,Chiu 及其同事训练了一组三个 DNN 来预测药物反应:一个用于编码突变信息,一个用于编码表达信息,以及一个整合前两个 DNN 的药物反应预测器网络(117)。他们发现这种方法能够识别已知和新的药物-癌症配对,有趣的是,他们发现表达数据比突变信息更有助于准确的预测。同样使用 DNN,Sakellaropoulos 及其同事使用 GDSC 细胞系训练了一个模型,然后将其应用于具有临床反应数据的各种基因组数据集(118)。使用预测的 IC 50值,他们将患者分为高灵敏度和低灵敏度组,并发现他们的 DNN 能够根据某些治疗方案下的存活率来区分患者。

使用深度学习的最大缺点之一是大多数方法缺乏对驱动预测的潜在生物学机制的可解释性。为了解决这个问题,Kuenzi 及其同事开发了 DrugCell,这是一种可解释的深度学习模型,它使用“可见神经网络”(VNN)来确保底层神经网络层次类似于已知的生物过程(119)。他们将这种 VNN 与为药物化学结构建模而构建的人工神经网络相结合,发现这种组合可以正确预测药物反应(比较预测疗效与实际疗效时,spearman ρ = 0.80),同时还提供了对潜在作用机制的深入了解- 驾驶反应。他们还展示了如何使用这种方法来预测协同药物组合,并在 AUC 为 0.75 的患者衍生异种移植模型中验证了他们的预测。

继 DrugCell 之后,一些方法试图将基因组数据与其他特征相结合,以预测单一药物或联合用药的疗效。Cortés-Ciriano 及其同事表明,通过将特定细胞系的化学信息与生物学信息(基因组学、转录组学和蛋白质组学)相结合,他们能够预测 NCI-60 数据集中 59 个细胞系中 17,000 多种化合物的功效(116)。将此分析扩展到药物组合,最近的 DREAM 挑战众包不同的模型来预测癌细胞类型子集中的药物协同作用。在提交了 80 多个不同的模型后,他们发现那些将基因组特征与其他信息(例如化学结构或已知的生物相互作用)整合在一起的模型往往会产生更高的整体准确度。120 )。同样,Gilvary 及其同事也报告说,使用一套多任务模型,该模型集成了基因组、靶点、化学和基于效果的特征,它们可以保持高预测准确性,同时还可以解卷积可能有助于预测协同作用的机制。121 )。

当前的挑战和未来的前景

人工智能具有无可争辩的潜力,可以加强对癌症患者的护理,并更广泛地影响癌症领域。在实验室环境中,它已显示出足够高的性能精度,理论上可以改变癌症研究和医学几乎所有阶段的传统做法(图 3)。在人工智能在替补席上取得巨大成功之后,问题变成了人工智能是否以及何时可以完全融入临床,成为医生和癌症患者的常规实践。

人工智能依靠数据运行;在临床环境中,充分捕捉整个人群的数据是开发强大的人工智能模型的关键。越来越清楚的是,种族和性别的差异以及社会经济差异会影响个体之间的疾病风险和复发。在癌症中,已经报道了基因组畸变的发生和频率的种族特异性变异(122)。Bhargava 及其同事的工作实际上表明,即使在组织形态水平上也存在种族特异性差异,疾病侵袭性的差异也存在于患有前列腺癌的白种人和非洲裔美国男性之间(123)。但是,通常用于训练和测试癌症 AI 模型的现有数据集在本质上仍然偏向某些种族和族裔群体。例如,TCGA 是各种癌症数据集的最大存储库,主要由具有欧洲血统的白人组成(122)。常用的大型数据集中还存在其他偏差。例如,TCGA 队列主要由原发性肿瘤组成,转移性肿瘤的可用性非常有限。细胞系是临床前药物开发的主力军,并且经常填充大型基因组数据集,它们不能准确地捕捉真实世界的患者资料,因为它们容易出现遗传漂移等问题(这是由于多个细胞导致的基因组差异)行段落)。随着患者来源的类器官变得更容易获得,基于细胞系的数据集将补充从这些类器官中获得的实验数据,这些数据在遗传上更稳定(124)。除了数据偏差之外,从各种平台获取数据的便利性与外部机构独立使用的数据访问便利性之间也存在差距,特别是对于私人或受控访问的数据集。随着未来的临床研究和相关数据集不断发展,变得更具包容性、协调性和易于访问性,这些挑战 AI 稳健临床实施的数据鸿沟也将被弥合。

除了数据共享,AI 模型的代码共享是另一个方面,可以确保模型是透明和可重复的,并且是临床使用的良好候选者。对于大多数已发表的研究,作者确实在外部数据集上验证了他们的模型,但为了使他们的模型真正可翻译和临床相关,它们应该在他人手中独立重现,就像任何其他可信的科学发现一样。这可以通过共享模型的详细记录代码以及优化的超参数和硬件规范的透明描述来实现。但正如 Haibe-Kains 及其同事指出的那样,尽管有多种可用的代码共享选项(例如 Github)与版本控制的虚拟环境(例如 Docker),125 )。值得庆幸的是,现在大多数知名期刊都要求提交代码和报告方法的详细描述,从而为提高透明度和共享访问铺平了道路。

同样值得注意的是,今天的人工智能癌症模型非常强调图像和组学数据。但是,患者健康和临床病史最丰富的数据源之一嵌入在患者的电子健康记录 (EHR) 中,并且仍未得到充分利用。造成这种情况的原因包括记录是非结构化的,具有高水平的噪音、稀疏和不一致,需要专门的管理和数据清理。这些挑战正在通过诸如观察性医疗结果合作伙伴通用数据模型等标准得到积极解决,该模型专注于将患者数据重组为易于使用的数据库,具有标准化的疾病代码和统一的词汇表。用户友好的软件进一步帮助了这一点,该软件允许纵向患者数据的可视化(例如,126, 127).

从临床角度看,建立临床医生对人工智能辅助决策的信任对于人工智能进入临床也至关重要。为此,Begoli 及其同事建议在 AI 模型中开发和采用系统和实用的不确定性量化措施(128)。模型中的不确定性可能来自数据的选择、数据的准确性和完整性、数据中的固有偏差、工件和模型错误规范。数据驱动预测模型中的不确定性估计是一个活跃的研究领域,未来将为改进模型和增强对人工智能辅助临床决策的信心提供一个系统框架。深度学习目前享有“黑匣子”的美誉,但本质上是在捕捉数据中的复杂相关性。因此,通过了解深度学习模型如何从给定数据中学习以及此类模型可以提供哪些细胞和分子机制见解来提高模型可解释性的额外研究,也将使临床医生更容易接受 AI 模型的临床使用。

前瞻性地思考,预防而不是治疗可能最终成为人工智能在癌症治疗中最引人注目的应用。开创性研究已经引导社区编制了一系列癌症风险因素。技术的进步使得在个体患者层面收集数据的各种方式成为可能。除了基因测试和 EHR,来自智能手机或其他可穿戴设备的传感器还为单个患者收集大量数据点。这些数据可以使人工智能通过感知生理和环境状态来提高诊断精度。它们可能有助于为每位患者制定高度个性化的疾病预防和治疗计划。这种人工智能系统可以帮助远程监测癌症患者,并在需要时提醒临床医生。未来,整合遗传易感性和 EHR 的 AI 模型,

 

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Meta.Qing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值