基于`肿瘤浸润淋巴细胞`的AI风险评分预测`鼻咽癌`的`无局部生存率`|顶刊速递·24-06-20

小罗碎碎念

本期分享的文献是“AI-Based Risk Score from Tumour-Infiltrating Lymphocyte Predicts Locoregional-Free Survival in Nasopharyngeal Carcinoma”,翻译一下,即—— 基于肿瘤浸润淋巴细胞的人工智能风险评分预测鼻咽癌无局部生存率

image-20240619112632790


文献概述

该研究开发了一种基于人工智能(AI)的方法,用于从肿瘤浸润性淋巴细胞(TILs)生成风险评分,以预测鼻咽癌(NPC)患者的局部无复发生存期(LRFS)

研究使用了来自中山大学肿瘤中心的385个全切片图像(WSIs),涵盖了367个病例。通过深度学习算法检测和量化TILs,并将它们分为12个等级,然后利用随机生存森林模型训练这些数据,以生成风险评分

研究结果表明,与EB病毒(EBV)DNA拷贝数相比,新提出的方法在局部复发病例中具有更强的预后价值。通过Kaplan-Meier分析,研究方法能够有效地区分低风险和高风险NPC病例,并且在验证集中显示出显著的统计结果(p < 0.001)。此外,该方法在无远处转移生存期(DMFS)、无进展生存期(PFS)和区域无复发生存期(RRFS)方面也显示出了预后价值。

研究还探讨了肿瘤细胞核形态学特征与LRFS风险组之间的差异发现低风险组的肿瘤细胞核在大小和形状不规则性上的平均值低于高风险组。此外,研究通过随机生存森林模型的特征重要性分析,确定了对最终数字NPC-TIL评分贡献最大的前三个特征。

这项研究的结论是,提出的AI方法可以利用常规的H&E组织学图像,为NPC预后提供一组新的数字TIL特征,这可能有助于临床治疗决策,并改善局部复发患者的结果。尽管这项研究的结果很有前景,但由于样本仅来自单一队列,并且在研究中没有考虑生活方式和共病等重要因素,因此在将这些发现应用于临床实践之前,需要在多中心队列中进行大规模验证。


知识点补充:局部无复发生存期

局部无复发生存期(Locoregional Recurrence-Free Survival,简称LRFS)是一个医学术语,用来描述癌症患者在初次治疗后,在原发肿瘤部位或其邻近区域(即局部或区域性淋巴结)没有出现肿瘤复发的情况下存活的时间长度。这个指标是衡量癌症治疗效果和评估患者预后的重要临床终点之一。

在癌症治疗中,尤其是在鼻咽癌等恶性肿瘤的治疗中,LRFS是一个关键的考量因素,因为它直接关联到患者治疗后的生活质量和长期生存率。如果患者在一段时间内没有局部或区域性复发,这通常意味着治疗效果较好,患者的预后可能更为乐观。相反,如果局部或区域性复发发生,可能需要进一步的治疗,如手术、放疗或化疗,这可能会影响患者的生活质量和生存预期。

在上述研究中,研究者通过AI方法评估了肿瘤浸润性淋巴细胞(TILs)的分布和密度,并将其转化为风险评分,用以预测鼻咽癌患者的LRFS。这种方法提供了一种新的工具,可能有助于医生更好地了解患者的复发风险,并据此制定个性化的治疗方案。


一、引言

鼻咽癌(NPC)是一种罕见恶性肿瘤,起源于鼻咽部上皮细胞,在鼻腔内的罗斯穆勒窝(Fossa of Rosenmuller)这一咽部隐窝中最为常见

image-20240619113246317

该肿瘤位置的特殊性使得其可以通过多种途径扩散[1-3]。鼻咽癌的病因涉及环境因素、遗传因素和感染Epstein-Barr病毒(EBV)[4-6]。NPC的主要治疗方法是放射治疗(RT)在晚期病例中,可辅以同步化疗、诱导化疗或辅助化疗[7,8]。

远处转移是治疗失败的主要原因。然而,在初步治疗5年后,10%至50%的病例会发生局部区域复发[9,10]。这可能导致进一步复发或身体其他部位转移的风险增加。早期发现和治疗局部区域复发可以防止肿瘤进一步扩散,改善NPC的预后[11]。

TNM分期系统是目前决定NPC患者治疗决策和预后的主要因素。然而,尽管处于相同分期的NPC患者接受了相似的治疗,他们的结果可能会有所不同[12]。NPC患者血浆中循环游离EBV DNA的水平已被证明是一个重要的预后标志物,并有助于确定适当的治疗[13,14]。然而,EBV DNA对局部区域复发的敏感性不如对远处转移的敏感性[15]。有研究表明,多达40%的局部复发与血浆EBV DNA的增加无关[16]。


NPC的一个特点是肿瘤浸润淋巴细胞(TILs)的存在[17]。

越来越多的研究关注TILs在各种类型的癌症(包括NPC)中的潜在预后价值[18]。在多种恶性肿瘤中,TILs在肿瘤微环境中的存在与较好的临床结果相关。在NPC中,TILs与肿瘤进展的关系一直是许多研究的主题。

有几项研究报告了TILs密度与NPC患者有利临床结果之间的正相关关系。特别是,TILs的存在与改善总生存期、无病生存期和远处转移生存期相关[19-22]。这些发现表明,TILs可能在宿主对NPC的免疫应答中发挥关键作用,并可能作为该疾病的预后生物标志物。尽管如此,为了消除主观性和观察者内部变异性,必须就TILs的定义和计数达成共识[23]。


与其他癌症类似,NPC的诊断和预后涉及一个多方面的方法。

这包括症状检查、体格检查、内窥镜检查、高级成像(MRI、CT、PET)和血液检测。为了进一步验证肿瘤的存在并完善诊断,进行病理学检测。这包括仔细检查组织样本以确认肿瘤的存在及其分级。同时,放射学评估用于癌症分期,有助于确定疾病的程度和严重性。这些诊断努力的累积是一个耗时且劳动密集型的过程,持续超过一周的时间。

人工智能(AI)和计算病理学在癌症治疗中有两个主要目标:自动化临床工作流程的某些部分,并利用同一工作流程中的数据获得新的见解[24]。

AI和计算病理学在包括NPC在内的癌症的诊断和预后中的应用正在开始取得令人鼓舞的结果[25-27]。例如,AI算法在检测内窥镜图像中的鼻咽肿块方面已被证明优于人类观察者[28]。在NPC诊断中使用全切片图像(WSIs)的另一个例子中,AI算法已显示出优于初级和中级病理学家[29]。AI在NPC预后任务中展示了其潜力,通过利用各种数据模态,如临床病理学数据、磁共振成像(MRI)、正电子发射断层扫描(PET)和WSIs,实现了高准确性[30-33]。

与其他数据模态如MRI和PET相比,WSIs提供了对细胞和组织结构的全面视角。然而,目前还没有研究探讨AI在NPC WSIs中对TILs的详细量化。

本研究的目标是使用基于AI生成的风险评分将局部晚期鼻咽癌患者分为高风险和低风险组。本研究探讨AI和计算病理学在开发基于数字TILs的NPC(数字NPC-TILs)预后评分方面的潜力,以评估局部区域无复发生存(LRFS)。除了LRFS,作者还研究了远处转移无生存(DMFS)、区域无复发生存(RRFS)和无进展生存(PFS)

通过采用AI和计算病理学,作者的方法提供了从广泛使用的H&E染色的组织学图像中客观评估TILs的能力。作者进行了详细的分析,并展示了新型数字TIL评分在LRFS以及其他生存终点方面具有预后价值。作者的研究提供了关于TILs、肿瘤微环境和NPC患者生存之间相关性的见解


二、材料和方法

2-1:数据收集

从中山大学肿瘤中心收集了396张完整的全切片图像(WSIs),这些图像来源于378例鼻咽癌(NPC)患者的苏木精和伊红(H&E)染色切片。所有WSIs都是使用Aperio扫描仪以40倍放大率和0.255微米每像素(mpp)的分辨率扫描的。

在总共378例病例中,有11例只有WSIs,没有伴随的临床信息,包括生存终点。因此,最终的数据集包含367例病例,共有385张WSIs对于具有多个WSIs的病例,特征被聚合为平均值

临床数据包括年龄、性别、原发肿瘤(T)、区域淋巴结(N)、分期组和血浆EBV DNA数据本研究不包括M(远处转移),因为作者的重点是预测局部复发性NPC患者的预后,不包括那些转移到其他器官的患者

此外,TNM分期状态是在患者出现早期症状的阶段获得的,因此尚未发生转移。与之前的研究[34]一样,血浆EBV DNA水平在治疗前通过针对EBV基因组的BAMHI-W区域的定量聚合酶链反应进行量化。结果以血浆每毫升EBV基因组拷贝的浓度报告。队列中的所有患者都接受了化疗和放疗


2-2:临床病理特征

本队列的中位随访时间为36个月,范围从1个月到79个月。生存数据通过将最大观察时间限制在60个月(5年)来进行右删失处理。所有患者的平均年龄为45岁,其中70.84%为男性。LRFS、DMFS、PFS和RRFS的事件百分比分别为5%、12%、17%和2%。

为了进行预后分析,作者使用4000拷贝/mL作为阈值将患者分为高EBV DNA组和低EBV DNA组(低:≤4000拷贝/mL,高:>4000拷贝/mL)。这个阈值的选择与最新的权威研究[35,36]保持一致。队列中包括167例高EBV DNA拷贝病例和200例低EBV DNA拷贝病例。

队列中的TNM分期是根据国际癌症联合会(UICC)和美国癌症联合会(AJCC)第八版分期系统进行的。根据TNM分期系统,大多数患者处于第3阶段(见表1)。


表1提供了鼻咽癌(NPC)患者队列的临床病理特征的总结。

image-20240619175353920

以下是对表格内容的分析:

  1. 年龄(Age):平均年龄为45.64岁,标准差(SD)为11.30岁。这表明研究中的患者年龄主要集中在中年,年龄分布相对均匀。

  2. 性别(Sex):男性占70.84%(260人),女性占29.16%(107人)。性别比例显示男性患者数量明显多于女性。

  3. 原发肿瘤(T)

    • T1期:8.17%(30人)
    • T2期:13.35%(49人)
    • T3期:53.95%(198人)
    • T4期:24.52%(90人)
      这显示了不同TNM分期中肿瘤大小和局部扩散的情况,其中T3期患者占比最高。
  4. 区域淋巴结(N)

    • N0期:9.81%(36人)
    • N1期:39.24%(144人)
    • N2期:34.60%(127人)
    • N3期:16.35%(60人)
      这反映了淋巴结受累的严重程度,N1期患者数量最多。
  5. 临床分期(Stage)

    • Ⅰ期:2.18%(8人)
    • Ⅱ期:8.17%(30人)
    • Ⅲ期:52.36%(194人)
    • Ⅳ期:36.78%(135人)
  6. EB病毒DNA拷贝数(EBV DNA copies)

    • ≤4000拷贝/mL:54.50%(200人)
    • 4000拷贝/mL:45.50%(167人)
      EB病毒DNA拷贝数是NPC预后的一个重要生物标志物,这里将其作为高风险和低风险的分界点。

这些数据为研究提供了基线特征,有助于了解患者群体的一般情况,并在后续分析中评估不同特征与局部无复发生存期(LRFS)之间的关系。


2-3:肿瘤细胞核检测与聚类

图1展示了研究中使用的主要工作流程,分为以下几个步骤:

A. 细胞核检测

image-20240619175618738

在40倍放大倍率下,使用HoverNet模型对细胞核进行检测和分类。这个步骤涉及到从H&E染色的组织切片图像中识别和分割出肿瘤细胞核和淋巴细胞核。HoverNet是一个深度学习模型,它能够同时进行细胞核的分割和分类,之前在PanNuke数据集上进行了训练。


B. 肿瘤细胞核聚类

image-20240619175713013

在检测到细胞核之后,使用基于密度的聚类方法(DBSCAN算法)对肿瘤细胞核进行聚类。这个步骤的目的是将空间上接近的细胞核聚集在一起,形成所谓的“内部肿瘤簇”(inner tumour cluster)。DBSCAN算法通过设置最大距离和最小样本数参数来避免簇之间的重叠,并且能够识别并排除离群点。


C. 数字TILs量化

image-20240619175728978

在确定了肿瘤簇之后,研究者量化了肿瘤浸润性淋巴细胞(TILs)。这包括计算肿瘤簇内外的淋巴细胞核的数量和密度,并将这些量化的数据转化为12个数字TIL特征,这些特征被统称为数字NPC-TILs。这些特征反映了TILs在肿瘤微环境中的空间分布和密度,可能与患者的临床结果相关。

整个工作流程利用了人工智能和计算病理学的方法,通过自动化的方式从常规的H&E染色组织切片图像中提取出可能具有预后价值的TILs特征。这种方法提供了一种新的工具,可能有助于改善对NPC患者预后的评估,并可能对治疗决策提供指导。


作者使用HoverNet模型[37]在40倍放大率的WSIs中检测、分割和分类细胞核,该模型是使用PanNuke数据集[38]进行训练的。

为了纠正细胞核的误分类,作者训练了一个深度学习模型,作者称之为MorphResNet,它融合了残差神经网络(ResNet[39])的深度特征和细胞核的形态学特征。作者使用了来自ResNet50倒数第二层的特征,该层是在ImageNet[40]数据集上预训练的。

作者选择ResNet模型是因为其广泛的应用,它不仅节省了计算成本和时间,而且在不降低预测能力的情况下保持了性能[41,42]。形态学特征包括偏心率、凸包面积、轮廓面积、等效直径、主轴长度、次轴长度、周长、坚实度、方向、半径和边界框面积

完整的模型架构如下。

image-20240619175945256


为了构建细胞核数据集,作者将PanNuke和MoNuSAC[43]的数据合并,创建了细胞核数据集

作者从MoNuSAC中选择性地包括了标记为“上皮”和“炎症”的数据。数据集中的每个细胞核图像都被提取并居中到64×64像素的大小,对于位于图像边缘附近的图像,作者添加了额外的填充。最终数据集中的细胞核图像总数为219,934。

作者使用Macenko[44]方法增强数据,以确保模型在图像染色变化上的泛化能力。数据按照80-10-10的比例分为训练、验证和测试集。作者使用Adam优化器对模型的所有层进行50轮训练。模型在测试集上达到了0.921的准确率和0.919的F1分数。模型的性能还通过定性的方式进行了评估,并得到了参与研究的医疗人员的认可。

作者根据细胞核的密度使用基于密度的空间聚类应用与噪声(DBSCAN)算法[45]进行肿瘤细胞核的聚类。此外,肿瘤簇扩大了60像素或15微米,形成了一个更大的区域的新簇。作者在DBSCAN中设置最大距离为200,最小样本数量为10。所有参数都是经验确定的。这些参数使作者能够避免簇之间的重叠

最初的簇被称为内部肿瘤簇(在肿瘤簇中间),而扩展的区域被指定为外部肿瘤簇。


2-4:数字TILs与肿瘤形态学

多项研究表明,肿瘤微环境(TME)与癌症生存率相关。

TME包括肿瘤区域周围的间质细胞,如成纤维细胞、内皮细胞和免疫细胞(淋巴细胞)。

在本研究中,作者的重点是肿瘤和淋巴区域及其与生存率的关系。作者基于H&E图像中的细胞核制定了数字化的TIL评分。肿瘤簇内外的所有淋巴细胞核都被定义为肿瘤浸润淋巴细胞(TILs)。

作者将位于内部肿瘤簇中的肿瘤细胞和TILs称为内肿瘤肿瘤细胞和内肿瘤TILs。相比之下,位于外部肿瘤簇中的肿瘤和TIL细胞核被定义为间质肿瘤细胞和间质TIL

image-20240619181412251

这两种类型的肿瘤细胞核和TIL在图1中有所展示。通过测量肿瘤细胞核和TIL的数量及其相应簇的面积,作者生成了12个数字TIL特征。作者称这组特征为数字NPC-TILs


数字NPC-TIL特征及其公式的完整列表可以在表S1中看到。

image-20240619181457227


表S9列出了用于分析肿瘤细胞形态学特征的9个指标。

作者从簇区域内的肿瘤细胞核计算了9个形态学特征。簇扩大区域内的肿瘤细胞核不计入形态学特征测量。

接下来,作者计算每位患者的形态学特征的均值,并用于下游分析

image-20240619181539650

以下是对这些特征的分析:

  1. Bounding Box:这是指围绕细胞的最小矩形框,用于界定细胞在图像中的位置和范围。

  2. Convex Area:凸包区域是指包含所有轮廓点的最小凸多边形的面积,反映了细胞的凸包形状。

  3. Contour Area:轮廓区域是基于细胞轮廓点围成的区域面积,这可以反映细胞的实际占据空间。

  4. Major Axis Length:主轴长度是细胞核最长直径的长度,可以指示细胞核的大小。

  5. Perimeter:周长是细胞边界的总长度,与细胞的大小和形状有关。

  6. Radius:半径是从细胞核中心到其边界的距离,可以用来衡量细胞核的紧凑程度。

  7. Solidity:实体性是指属于细胞区域感兴趣(ROI)内的像素比例与细胞凸包内总像素的比例,高实体性意味着细胞区域更加紧凑和圆形。

  8. Equivalent Diameter:等效直径是具有与细胞相同面积的圆的直径,是一个描述细胞大小的简化指标。

  9. Eccentricity:偏心率是描述细胞形状圆形或椭圆形程度的指标,接近1表示非常椭圆形,接近0表示接近圆形。

这些特征被用来量化肿瘤细胞的形态学特性,它们在肿瘤学研究中非常重要,因为细胞的形态学变化可能与肿瘤的生物学行为(如侵袭性、转移潜力)有关。

在鼻咽癌等疾病的研究中,通过分析这些形态学特征,可以更好地理解肿瘤的微环境,以及它们如何影响疾病的进展和患者的预后。

此外,这些特征还可以作为开发计算机辅助诊断工具的基础,帮助病理学家在诊断过程中做出更准确的判断。


2-5:生存分析

在本研究的生存分析中,作者将局部区域无复发生存(LRFS)确定为主要终点,并额外考察了远处转移无生存(DMFS)、区域无复发生存(RRFS)和无进展生存(PFS)等终点。在研究期最后一天未发生事件的病人被标记为删失事件。整个流程,从细胞核检测和分类到数字TIL评分和统计分析,均使用了Python 3.7编程语言。

本研究旨在开发具有NPC预后价值的数字化人工智能生物标志物。作者在生存分析中使用了四组特征

  1. 数字TIL评分

  2. 临床病理学数据(年龄、性别、TNM分期和EBV DNA水平)

  3. 肿瘤细胞核形态学

  4. 数字NPC-TIL评分与肿瘤细胞核形态学的组合

作者使用三折交叉验证在每个特征集上训练了随机生存森林(RSF)模型。进行了网格搜索以确定RSF的最优参数。为了从模型中评估风险评分预测,作者使用了PySurvival [47] Python包中的concordance_index函数来计算Harrell的C指数(一致性指数)[46]。C指数评估了预测生存结果与实际生存结果之间一致性的概率[48]。

随后,作者评估了RSF模型中风险评分的预后价值,以将患者分层为低风险和高风险组。风险评分等于或低于截止值的病人被视为低风险,反之亦然。截止值在发现集中确定,并使用Cutoff Finder [49]进行计算。作者在验证集中使用Kaplan-Meier(KM)曲线分析和log-rank检验来评估NPC预后中提出的生物标志物。

此外,作者进行了单变量和多变量分析,以评估风险因素与生存结果之间的关系,使用了Cox比例风险(Cox PH)模型。作者使用了lifelines Python包中的危害比(HR)、C指数、95%置信区间(CI)和p值来评估Cox PH模型。所有统计分析均采用双尾检验,p值小于0.05被认为具有统计学意义。

为了进行预后价值评估以及单变量和多变量分析,作者将数据分为了发现集和验证集。验证集被设置为数据的30%,并根据相应终点的事件对数据进行分层。


三、结果

如前所述,本研究在鼻咽癌(NPC)预后方面比较了四组特征:临床病理学特征、数字化鼻咽癌肿瘤浸润淋巴细胞(NPC-TILs)、肿瘤形态学特征,以及数字化NPC-TILs与肿瘤形态学特征的结合。

通过进行三折交叉验证实验来评估所提出的人工智能模型的泛化能力。在交叉验证中,数据被随机打乱并分层为三个组/折。这些折被用于随机生存森林(RSF)模型的发现和验证。对于每个验证折,作者根据发现折中获得的数字化TIL特征及其值,使用RSF计算风险评分。


3-1:基于数字化NPC-TILs风险评分的患者分层

在本研究的生存分析中,作者将局部区域无复发生存期(LRFS)确定为主要的终点指标。同时,作者还考察了其他终点指标,如远处转移无复发生存期(DMFS)、疾病复发无复发生存期(RRFS)和无进展生存期(PFS)。

在研究期最后一天没有事件发生的患者被标记为删失事件。在整个流程中,从细胞核的检测和分类到数字化TIL评分和统计分析,作者使用了Python 3.7编程语言。LRFS、DMFS、PFS和RRFS的患者分层截止值分别为4.52、7.42、28.20和3.86。

image-20240619211652638

如图3所示,作者提出的数字化NPC-TIL评分能够以统计学上的显著性结果(p = 8.13 × 10^-5)对低风险和高风险的NPC病例在LRFS中进行分层。在其他生存终点指标,如DMFS(p = 5.83 × 10^-4)、PFS(p = 6.24 × 10^-4)和RRFS(p = 5.67 × 10^-3)中,也获得了类似的结果。


3-2:预测风险评分与事件发生时间的相关性分析

作者检验了数字化NPC-TIL评分在生存预测中的性能,使用随机生存森林(RSF)模型,并将其与其他特征集进行了比较。

单独使用数字化NPC-TIL评分在LRFS方面的表现优于其他特征集。在发现集中,数字化NPC-TIL评分达到了平均C指数为0.923,在验证集中为0.785。与此同时,其他特征集的C指数值较低(见表2)。

image-20240619211830374

此外,数字化NPC-TIL评分在其他生存终点指标中也提供了最高的C指数。在RRFS中,它达到了0.780的C指数,在PFS中达到了0.667。在DMFS的情况下,数字化NPC-TIL评分达到了0.645的C指数,低于与临床特征相关的0.670的C指数。

完整的C指数结果请参见表S2。

image-20240619211933928


3-3:单变量分析

作者使用Cox比例风险回归模型检查了每个临床病理学数据单一风险因素与数字化TILs风险评分与LRFS之间的关系(见表3)。

image-20240619212009804

在单变量分析中,作者发现只有数字化NPC-TIL评分对LRFS具有预后价值(p < 0.05),风险比(HR)为1.58(95%置信区间(CI)= 1.13–2.19)。


作者还发现数字化NPC-TIL评分在DMFS和PFS中具有显著的预后价值。

DMFS中,EB病毒DNA拷贝数(HR:3.88,95% CI:1.21–12.47,p < 0.05)和提出的数字化NPC-TIL评分(HR:1.36,95% CI:1.14–1.16,p < 0.001)与生存结果显著相关。

image-20240619212225356

PFS中,N分期为3(HR:6.7,95% CI:1.45–30.88,p < 0.05)和数字化NPC-TIL评分(HR:1.08,95% CI:1.03–1.14,p < 0.005)也与PFS结果显著相关。

image-20240619212359722

相比之下,数字化NPC-TIL评分与RRFS结果的相关性不显著(HR:1.65,95% CI:0.85–3.21,p值为0.1388)。此外,验证集中其他特征与RRFS的相关性也不显著。

image-20240619212320359


3-4:多变量分析

LRFS的多变量分析结果见表4。

image-20240619212527292

在多变量分析中,作者发现只有数字化TILs的风险评分在NPC中具有预后价值(p < 0.05,HR = 1.59,95% CI = 1.11–2.28)。


RRFS

image-20240619212918363


PFS

image-20240619213033891

数字化NPC-TIL评分在DMFS(p < 0.005,HR = 1.35,95% CI = 1.10–1.67)和PFS(p < 0.005,HR = 1.08,95% CI = 1.02–1.14)也具有预后价值。

除了数字化NPC-TILs之外,只有性别协变量在DMFS中具有预后价值。多变量分析的完整列表可以在表S6–S8中找到。


3-5:低风险组与高风险组的数字化NPC-TIL评分

为了进一步探究数字化NPC-TIL评分在低风险组与高风险组之间的差异,作者在验证集中进行了分析。

根据数据分布,作者进行了t检验或Mann–Whitney U检验,以比较两组之间的平均值。如图4所示,在LRFS中,低风险组的12个数字化NPC-TIL特征的平均值显著高于高风险组(p < 0.05)。

image-20240619213136377

在检查WSIs时,低风险组与高风险组之间数字化NPC-TILs的差异是明显的;例如,图5所示的TILs比率。

image-20240619213220171

图中的红色对象是癌细胞核,绿色对象是淋巴细胞核。可以看出,与预后不良的病例相比,预后良好的病例中淋巴细胞的数量显著更多。在这个特定案例中,肿瘤簇中几乎没有淋巴细胞浸润。


3-6:肿瘤核形态学分析

作者还检查了在LRFS低风险组与高风险组中肿瘤形态学的差异。

为此,作者从肿瘤簇中所有肿瘤细胞核提取了九个形态学特征。作者研究了肿瘤细胞核的大小和形状不规则性;较高的值表示肿瘤细胞核更大,形状的不规则性增加。作者使用了与图4所示相同的方法来测试两组之间的统计学显著差异。这种分析的结果可以在图6中观察到。

image-20240619213304864

图6中前两行的特征代表肿瘤细胞的大小,而其余特征代表形状的不规则性。与高风险组相比,低风险组中的所有九个形态学特征的平均值都较低。除了固体性和偏心率之外,所有特征都显示出统计学上的显著差异(p < 0.05)。


3-7:模型可解释性分析

与其他基于树的算法类似,随机生存森林(RSF)通过特征重要性提供了模型的可解释性。

利用RSF的特征重要性,作者分析了验证集中12个数字化TIL评分对最终数字化NPC-TIL评分的贡献程度。如图7所示,在LRFS中最重要的前三个特征是肿瘤间质TIL密度、间质TIL比例和TIL密度簇

image-20240619213401231

间质TIL特征(包括肿瘤和比例)指的是位于肿瘤簇外缘的淋巴细胞。此外,在所有生存终点(图S2)中出现频率最高的特征是TIL密度簇,它捕获了关于肿瘤簇内和周围的TIL数量的信息。

image-20240619213443850

image-20240619213527733


四、讨论

本研究针对鼻咽癌(NPC)的肿瘤微环境(TME)中的免疫特征在预后中的作用进行了深入探讨。

当前,TNM分期系统及其临床数据的局限性促使人们越来越关注TME的免疫特征在NPC预后中的重要性。尽管在其他类型的癌症中,TME的免疫特征(如TILs)显示出有前景的结果,但在NPC中的研究文献却相对匮乏。此外,大多数免疫特征的主观评估容易受到观察者间和观察者内变异性影响。

为了解决这个问题,本研究提出了一种基于人工智能和计算机视觉的新方法,用于自动评分NPC中H&E全切片图像(WSIs)的TILs。作者开发了12个数字TIL特征,并将它们组合成一个单一的NPC-TIL评分。分析表明,这一评分是NPC在局部区域无复发生存(LRFS)和其他生存结果中的独立预后因素。

本研究在三个位置捕获了TIL信息:内部肿瘤簇(肿瘤簇中间)、外部肿瘤簇(肿瘤簇扩大区域)以及两者都有。每个位置包括四组数字NPC TILs。从内部肿瘤簇提取的TILs被标记为“内肿瘤”,因为它们描述了高密度肿瘤区域内的淋巴细胞。此外,从外部肿瘤簇提取的TILs被标记为“间质”,因为它们位于肿瘤簇周围

第一组数字NPC TILs提供了淋巴细胞数量与肿瘤细胞数量的分布,命名为TIL比例、内肿瘤TIL比例和间质TIL比例。第二组提供了淋巴细胞数量与肿瘤细胞总占据面积之间的关系,命名为TIL密度肿瘤、内肿瘤TIL密度肿瘤和间质TIL密度肿瘤。最后,第四组深入探讨了空间方面,考虑了淋巴细胞细胞覆盖的总面积与肿瘤细胞总面积的关系,命名为TIL面积比例、内肿瘤TIL面积比例和间质TIL面积比例。

在三个不同位置采用这四组特征集,不仅增强了作者量化TILs数量的能力,还增强了作者对其在肿瘤微环境内复杂相互作用中的空间分布和密度的理解。


EBV DNA是NPC远处转移的重要生物标志物。

然而,这个标志物对远处转移的敏感性高于局部区域复发的敏感性。在Cox-PH建模的单变量和多变量分析中,作者显示数字NPC-TIL评分是NPC LRFS的一个强有力预后因素。通过使用这一风险评分对局部区域复发的NPC患者进行低风险和高风险分层,得到了统计学上显著的结果(p < 0.001)。


研究目标

本研究的目标是通过从组织学图像中基于人工智能的风险评分,对局部晚期鼻咽癌患者进行高风险和低风险组的分层。对于低风险鼻咽癌患者,可以实施“降级”治疗策略,以提高其生活质量

同时,对于高风险局部晚期鼻咽癌病例,可以考虑额外的治疗措施,如诱导化疗后使用卡培他滨的维持治疗或结合全程免疫治疗


数字NPC-TIL评分在LRFS中的NPC预后

如图4所示,良好预后者的数字NPC-TIL评分显著高于预后不良者。

image-20240619182035664

作者的肿瘤细胞核形态学分析表明,数字NPC-TIL评分可以捕获局部复发病例中的核异常。在预后不良的病例中,肿瘤细胞核倾向于有更大的尺寸和更多的不规则形状。已知肿瘤核异常是许多肿瘤的标志性特征

通过检查RSF模型的模型可解释性,作者发现TIL密度簇是数字NPC-TILs中最重要的特征在所有生存终点的重要性最高。这一特征捕捉了肿瘤簇内部和周围的TIL数量信息,指向肿瘤微环境内的免疫反应,并确认TILs的存在和数量对NPC患者预后有影响。


五、结论

本研究介绍了一种新颖的人工智能方法,该方法利用常规的H&E组织学图像,并为鼻咽癌(NPC)预后开发了一套新颖的数字TIL特征。

据作者所知,这是首个研究自动化H&E图像中NPC的TIL评分,并展示出潜在的预后标志物,这些标志物可以帮助评估患者治疗的研究。该研究为NPC预后中潜在的数字免疫标志物提供了重要见解。

数字NPC-TIL评分可能潜在地被用来协助治疗决策,并在局部复发的情况下改善患者结果。尽管本研究中关于数字TILs的发现很有前景,但作者的样本仅来源于单一队列

此外,缺乏关于生活方式和合并症等重要因素的信息也是另一个限制。在多中心队列上进行大规模验证是本研究结果能够在临床实践中实施之前所需的。

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=data%3Aimage%2Fsvg%2Bxml%2C%253C%253Fxml%20version%3D’1.0’%20encoding%3D’UTF-8’%253F%253E%253Csvg%20width%3D’1px’%20height%3D’1px’%20viewBox%3D’0%200%201%201’%20version%3D’1.1’%20xmlns%3D’http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg’%20xmlns%3Axlink%3D’http%3A%2F%2Fwww.w3.org%2F1999%2Fxlink’%253E%253Ctitle%253E%253C%2Ftitle%253E%253Cg%20stroke%3D’none’%20stroke-width%3D’1’%20fill%3D’none’%20fill-rule%3D’evenodd’%20fill-opacity%3D’0’%253E%253Cg%20transform%3D’translate(-249.000000%2C%20-126.000000&pos_id=img-hqCavn2X-1718813045282)’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

  • 10
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值