人工智能在结直肠癌免疫微环境分析中的应用|顶刊精读·24-08-07

小罗碎碎念

本期推文

这篇文章《Prognostic Significance of Immune Cell Populations Identified by Machine Learning in Colorectal Cancer Using Routine Hematoxylin and Eosin–Stained Sections》于2020年发表在《Clin Cancer Res》,目前IF=10。

这篇文章详细介绍了病理AI的常规处理套路,讲解了如何使用QuPath完成前期的工作,这是目前发表的顶刊不会涉及的内容,这也是大多数人看了文献以后,仍然不清楚如何开展自己工作的一个重要原因。

这篇文章想要研究的内容也很常规——自动识别和量化结直肠癌肿瘤组织中的多种免疫细胞,包括淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞。这项技术的应用不仅提高了病理分析的效率和准确性,而且为癌症预后评估提供了新的生物标志物。

研究结果揭示了肿瘤基质中免疫细胞密度与结直肠癌特异性生存率之间的显著关联,特别是高密度的基质淋巴细胞和嗜酸性粒细胞与更好的预后相关。这些发现对于理解肿瘤微环境中免疫细胞的作用机制具有重要意义,并可能指导未来的精准医疗策略,例如免疫治疗的适应症选择和疗效监测。


文献概述

这篇文章是发表在《Clinical Cancer Research》上的一篇关于结直肠癌精准医疗和影像学的研究。

image-20240807101555194

角色姓名单位
第一作者Juha P. Väyrinen1. 丹娜-法伯癌症研究所和哈佛医学院医学系肿瘤学系, 波士顿, 马萨诸塞州, 美国
2. 奥卢大学医院医学研究中心癌症与转化医学研究组, 奥卢, 芬兰
3. 奥卢大学, 奥卢, 芬兰
第一作者Mai Chan Lau2. 布里格姆和妇女医院及哈佛医学院病理系MPE分子病理流行病学项目, 波士顿, 马萨诸塞州, 美国
通讯作者Jonathan A. Nowak2. 布里格姆和妇女医院及哈佛医学院病理系MPE分子病理流行病学项目, 波士顿, 马萨诸塞州, 美国

研究的目的是探讨通过机器学习在常规的苏木精-伊红(H&E)染色切片中识别的免疫细胞群体对于结直肠癌预后的意义

研究设计包括使用数字图像处理技术来识别结直肠癌肿瘤内皮和基质区域内的淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞,共分析了两个前瞻性队列研究中的934例结直肠癌病例。研究使用多变量Cox比例风险回归模型来计算根据细胞密度四分位数的死亡率风险比(HR)

此外,研究还使用GTumor:Immune cell功能来评估样本中任何肿瘤细胞在特定半径内至少有一个邻近的指定类型的免疫细胞的可能性,并在570例结直肠癌的独立队列上进行了验证研究。


研究结果显示,自动分类器测量的免疫细胞密度与手动计数和独立训练的自动分类器获得的密度具有很高的相关性(Spearman’s r 0.71–0.96)。基质淋巴细胞和嗜酸性粒细胞的高密度与更好的癌症特异性生存相关[Ptrend < 0.001; 多变量HR (嗜酸性粒细胞第四四分位数vs第一四分位数), 0.49; 95%置信区间, 0.34–0.71]。高GTumor:Lymphocyte AUC0,20mm和高GTumor:Eosinophil AUC0,20mm也与更好的癌症特异性生存相关。在验证队列中,基质嗜酸性粒细胞的高密度也与更好的癌症特异性生存相关(Ptrend < 0.001)。

研究结论强调了使用机器学习评估H&E染色切片以提供稳健的定量肿瘤-免疫生物标志物的潜力,这些生物标志物可用于精准医疗,并识别以前被低估的免疫细胞亚群,这些亚群具有预后相关性。

文章还讨论了结直肠癌的免疫细胞特征,包括淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞的检测和定量,以及它们与肿瘤和患者特征的关系。此外,还探讨了免疫细胞浸润的空间特征与肿瘤细胞的关系及其预后意义。最后,研究在独立的癌症基因组图谱(TCGA)结直肠癌队列中验证了这些发现。


一、引言

结直肠癌是全球第三常见的恶性肿瘤,也是癌症死亡的第二大原因(1)。结直肠癌的预后分类主要基于疾病分期(2, 3)。

然而,每个肿瘤都是独特的,由复杂的病理过程驱动,其中许多过程是由肿瘤细胞与宿主之间的相互作用介导的(4)。因此,额外捕获这些关联的预后参数可能有助于作者将患者分类到更同质、治疗上相关的亚组。

结直肠癌由多种细胞类型组成,包括肿瘤细胞、成纤维细胞、内皮细胞和免疫细胞,这些细胞共同构成了肿瘤微环境(5)。越来越多的证据表明,肿瘤可能引发适应性抗肿瘤免疫反应(6)。实际上,结直肠癌中肿瘤浸润性T淋巴细胞的密度较高与改善的临床结局相关(7)。

通过测量肿瘤中心和侵袭边缘的CD3+和CD8+ T细胞密度生成的免疫评分(ImmunoScore)的预后价值,在一项涉及来自13个国家的数千名结肠癌患者的国际多机构研究中得到了验证(8)。尽管先天免疫细胞,如中性粒细胞和嗜酸性粒细胞,也是结直肠癌中的主要细胞群体,但它们的预后意义尚未像T细胞那样明确(7, 9)。

尽管浆细胞在结直肠癌中的潜在预后价值相对较少受到关注,但B细胞和第三级淋巴样结构已被报道与结直肠癌的预后(7)和黑色素瘤的免疫治疗反应(10)相关。因此,作者旨在研究浆细胞,这是在苏木精-伊红(H&E)染色的组织切片中唯一可以可靠识别的B细胞亚群。分析参与适应性和先天性免疫的不同类型的免疫细胞,有助于开发改进的预后生物标志物,并可能促进对结直肠癌生物学的更好理解。

在本研究中,作者使用监督机器学习对来自两个大型美国前瞻性队列研究的结直肠癌患者的H&E染色组织微阵列(TMAs)的数字图像进行了淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞的识别和量化。这些细胞位于肿瘤上皮内和间质区域。

为了作者的主要目标,作者测试了这些免疫细胞密度较高可能与更好的预后相关的假设。在探索性分析中,作者研究了这些细胞类型密度与肿瘤和患者特征之间的关系,以及免疫细胞浸润的空间特征与肿瘤细胞的预后意义。为了验证这些发现,作者分析了570例结直肠癌的独立队列。


二、材料与方法

2-1:研究人群与数据收集

本研究利用了两个美国全国范围的前瞻性队列研究,护士健康研究(NHS,自1976年起跟踪121,701名女性)和卫生专业人员随访研究(HPFS,自1986年起跟踪51,529名男性)。

在这些人群中,作者记录了截至2014年随访期间发生的4,420例结直肠癌病例。基于随访数据的可用性和组织微阵列(TMAs)中足够的组织样本,作者分析了934例腺癌中的免疫细胞密度(表1)。作者根据结直肠连续体模型(11)包括了结肠和直肠癌。


表1提供了结直肠癌病例的临床、病理和分子特征,并根据肿瘤基质免疫细胞密度进行了分类。

image-20240807111956873

  1. 研究对象总数:共有934例结直肠癌病例被纳入分析。

  2. 免疫细胞密度中位数:表中列出了四种免疫细胞类型(淋巴细胞、浆细胞、中性粒细胞、嗜酸性粒细胞)的密度中位数以及25%和75%分位数。淋巴细胞密度最高,其次是中性粒细胞、浆细胞和嗜酸性粒细胞。

  3. 性别分布:女性占56%,男性占44%。女性患者的淋巴细胞、中性粒细胞和嗜酸性粒细胞密度略高。

  4. 年龄分布:31%的患者年龄小于65岁,69%的患者年龄65岁及以上。

  5. 诊断年份:诊断年份分为三个时间段,1995年及以前、1996-2000年、2001-2008年。

  6. 家族史:79%的患者没有结直肠癌的一级亲属家族史,21%的患者有家族史。

  7. 肿瘤位置:肿瘤位置涵盖了盲肠、升结肠至横结肠、脾曲至乙状结肠和直肠。

  8. 肿瘤分化程度:90%的肿瘤分化程度为中度到良好,9.6%的肿瘤分化程度差。

  9. 肿瘤AJCC分期:分期从I到IV,其中23%为I期,33%为II期,29%为III期,16%为IV期。

  10. 微卫星不稳定性(MSI)状态:83%的肿瘤为非MSI高,17%的肿瘤为MSI高。

  11. CpG岛甲基化表型(CIMP)状态:82%的肿瘤CIMP状态为低或阴性,18%为高。

  12. LINE-1甲基化水平:63%的肿瘤LINE-1甲基化水平≥60%,37%的肿瘤<60%。

  13. KRAS、BRAF和PIK3CA突变状态:分别有59%、85%和83%的肿瘤KRAS、BRAF和PIK3CA基因野生型,而相应的突变型比例分别为41%、15%和17%。

  14. 新抗原负荷:新抗原负荷分为四个等级,从最低(Q1)到最高(Q4)。

表1的数据为研究人员提供了不同免疫细胞密度与结直肠癌患者的多种临床、病理和分子特征之间的关联信息,有助于进一步分析免疫细胞在结直肠癌中的作用和预后价值。


作者采用逆概率加权(IPW)方法和4,420例病例的协变量数据来调整由于肿瘤组织可用性在934例病例中引起的选择偏倚。

研究医生在不知道暴露数据的情况下,审查了与结直肠癌相关的医疗记录,并记录了临床信息,包括美国癌症联合委员会(AJCC)的肿瘤、淋巴结、转移分期(第5版或第6版)和肿瘤位置。使用国家死亡指数来确认研究参与者的死亡情况,并识别未报告的致命结直肠癌病例。

患者被随访至死亡或随访结束(HPFS为2014年1月1日;NHS为2014年5月31日),以先到者为准。生存时间定义为从结直肠癌诊断日期到死亡或未死亡者的随访结束日期。

从患者进行原发肿瘤切除的医院收集了甲醛固定石蜡包埋的组织。审查了所有结直肠癌病例的组织切片,并由一名研究病理学家(S. Ogino)确认诊断。记录了组织病理学特征,包括肿瘤分化(良好/中等与差)、印戒细胞形态的范围和细胞外粘蛋白的范围。

从甲醛固定石蜡包埋的肿瘤块中提取DNA,以评估微卫星不稳定性(MSI)和CpG岛甲基化表型(CIMP)状态(12)、KRAS(13)、BRAF、PIK3CA突变(14)、长散在核苷酸元素-1(LINE-1)甲基化水平(15)以及从肿瘤和正常DNA对的整个外显子测序计算的新抗原负荷(参考16;补充表S1)。

image-20240807112515395


使用来自结直肠癌手术切除标本的甲醛固定石蜡包埋组织的组织核心构建TMAs,如前所述(17)。核心直径为0.6毫米,从原发肿瘤的非周边区域选择核心,以最佳代表整体肿瘤形态。研究遵循美国通用规则进行,从所有参与者获得了书面知情同意。研究方案得到了布莱根妇女医院和哈佛T.H. Chan公共卫生学院(波士顿,MA)以及参与注册机构的机构审查委员会的批准。

作为独立验证队列,作者包括了癌症基因组图谱(TCGA)结直肠腺癌研究(18)。作者使用了集成在TCGA泛癌症临床数据资源中的临床元素和生存结果数据(19)。TCGA数据门户中有616例的数字化H&E染色组织学切片可用。作者排除了图像不具有代表性(图像未显示原发性结直肠癌;图像被切片标记遮挡或模糊;或图像扫描放大倍数低于20倍)的病例,或没有随访数据的病例,最终分析中包括了570名患者(补充表S2)。

image-20240807112629359


2-2:免疫细胞检测与定量

从TMA块中切取了两块4毫米厚的切片,垂直深度至少为50毫米。这些H&E染色的切片在一组中使用Vectra 3.0自动化定量病理成像系统(Akoya Biosciences)扫描,该系统配备了20倍物镜。只包括在整个成像核心区域内超过10%肿瘤的核心。总共每个肿瘤有1到8张图像[中位数3,四分位数范围(IQR)2-4]。

QuPath v0.1.2,一款用于数字病理图像分析的开源软件(20),用于检测和计数上皮内和间质淋巴细胞、浆细胞、嗜酸性粒细胞和中性粒细胞。这些细胞类型是根据H&E染色切片中的独特形态学特征选择的。

评估是在不知道研究终点的情况下进行的。该方法始于两个并行的、独立病理学家监督的算法处理步骤:

(i)细胞检测和分类;(ii)组织类别分类(图1;补充表S3)。

Figure 1 描述了一种自动化图像分析流程,用于在结直肠癌组织微阵列(TMAs)的H&E染色切片中检测、量化免疫细胞以及进行区域分割。

image-20240807113158965

  1. 原始图像:分析从H&E染色的结直肠癌TMA切片开始。

  2. 细胞检测:使用自动化算法识别图像中的细胞,例如肿瘤细胞、淋巴细胞、浆细胞、中性粒细胞、嗜酸性粒细胞等。

  3. 超像素分割:通过超像素分割技术将图像分割成多个区域,每个区域具有相似的颜色和纹理特征,有助于后续的细胞分类。

  4. 细胞检测与分类:在超像素分割的基础上,进一步识别和分类不同的细胞类型。

  5. 组织类别分类:区分肿瘤组织的不同区域,如肿瘤上皮、基质、坏死区和其他。

  6. 合并:将细胞检测和组织区域分类的结果合并,以计算肿瘤内皮和基质区域中不同免疫细胞的密度。

  7. 空间分析数据:为每个细胞提供空间信息,用于进一步的分析,例如评估免疫细胞与肿瘤细胞的空间关系。

  8. 细胞测量和超像素测量:对细胞和超像素进行测量,以获取细胞的形态学特征。

  9. 超像素分类和细胞分类:基于测量结果,对超像素和细胞进行分类,确定它们属于哪种类型的细胞或组织。

  10. 区域分割示例:展示了基于H&E染色的图像中不同细胞类型(如嗜酸性粒细胞、中性粒细胞、浆细胞、淋巴细胞)的区域分割示例。

整个流程利用了机器学习和图像分析技术,自动化地从复杂的组织切片图像中提取有关免疫细胞分布和密度的信息。这种方法提高了分析的效率、一致性和可重复性,有助于在大规模队列研究中评估肿瘤微环境中免疫细胞的作用。


Supplementary Table S3 详细描述了使用 QuPath 软件从苏木精-伊红(H&E)染色切片的图像中检测和量化免疫细胞以及进行组织类别分类的步骤。

image-20240807113401107

  1. 细胞检测和分类

    • Estimate stain vectors:估计染色矢量和背景值,以使用颜色去卷积方法帮助分离染色。
    • Simple tissue detection:区分组织区域和空白背景。
    • Cell detection:基于细胞核的大小、形状和苏木精层的光密度识别细胞,并为每个细胞计算33个特征,包括核面积、核圆形度、核和细胞质的苏木精和伊红光密度,以及核与细胞面积比率。
    • Add intensity features:计算每个细胞的 Haralick 纹理特征以及染色和颜色强度特征。
    • Add smoothed features:计算邻近细胞中细胞测量的高斯加权平均值。
    • Create detection classifier:训练随机森林分类器,以识别淋巴细胞、浆细胞、中性粒细胞、嗜酸性粒细胞、肿瘤细胞和其他细胞。
  2. 组织类别分类

    • Estimate stain vectors:与细胞检测步骤相同,估计染色矢量和背景值。
    • Simple tissue detection:与细胞检测步骤相同,区分组织区域和背景。
    • SLIC superpixel segmentation:将组织区域划分为超像素(具有相似特征的像素组)。
    • Add intensity features:计算每个超像素的 Haralick 纹理特征以及染色和颜色强度特征。
    • Add smoothed features:计算邻近超像素中超像素测量的高斯加权平均值。
    • Create detection classifier:训练随机森林分类器,将超像素分类为四种组织类别:肿瘤上皮、基质、坏死和其他(包括空白、粘液和伪影)。

此外,还提到了一些针对 TCGA 切片图像的特定步骤:

  • 在 TCGA 切片图像中,使用脚本(Estimate_background_values.groovy)估计切片特定的背景值,以设置每个图像的红色、绿色和蓝色通道的平均背景强度,因为这些图像的背景强度变化显著。
  • 在 TCGA 切片图像中,使用刷子工具注释分析区域,选择最能代表整体肿瘤形态学和免疫细胞浸润的区域,同时排除坏死区域和肿瘤边缘。

最后,提到了训练分类器的过程:在 NHS/HPFS 队列的150张图像子集中进行了训练,然后将分类器应用于所有图像。由于队列之间的图像和染色特征存在差异,因此为 TCGA 队列训练了单独的分类器。

这些步骤说明了如何使用 QuPath 软件结合机器学习算法自动化地从 H&E 染色的组织切片图像中提取有关免疫细胞分布和组织特征的信息。这种方法提高了分析的效率和可重复性,并有助于在大规模队列研究中评估肿瘤微环境中免疫细胞的作用。


细胞身份数据从QuPath导出,带有细胞坐标,而组织类别则导出为二进制组织类别掩模图像。通过坐标映射将单个细胞分配到组织类别中,其中每个组织类别的坐标是从组织类别掩模图像中使用R统计编程语言(版本3.5.3;R基金会 for 统计计算)和imager包确定的。

为了计算每个组织隔室中的免疫细胞密度,作者首先计算了感兴趣的免疫细胞类型在该隔室中的细胞数量,然后将计数除以组织面积(mm²)。对于有多个肿瘤核心的病例,计算所有可用核心的平均(均值)密度。

为了验证免疫细胞定量方法与人类评估的准确性,一位病理学家(J.P. Vayrynen)手动注释了80个肿瘤核心图像中的免疫细胞,总共得到了13,713个分类的免疫细胞。为了评估自动计数的观察者间重复性,另一位研究医生(S.A. Vayrynen)使用一个单独训练的细胞分类器独立处理所有肿瘤核心图像。

作者使用了非线性降维算法——统一流形近似和投影(UMAP;使用umap R包;参考21),将高维数据(即淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞的表皮内和间质密度)投影到二维空间进行可视检查,以检查TMA或诊断年份对免疫细胞密度的影响。


2-3:评估肿瘤-免疫空间关系

多类型G函数“G-交叉”是基于点过程理论的统计分析方法。

肿瘤:免疫细胞G-交叉(GTumor:Immune cell)代表一个最近邻距离分布函数,它估计在任意肿瘤细胞周围r半径内找到至少一个免疫细胞的概率。作者基于观察到的最近邻距离计算了经验分布函数,使用spatstat R包(23)。

这项分析包括了表皮内和间质免疫细胞。由于分析窗口外不可观察点的边缘效应,估计G-交叉函数受到阻碍。因此,作者通过Kaplan-Meier方法应用边缘校正。

为了量化能够有效与肿瘤细胞进行细胞间相互作用的可能免疫细胞浸润水平,作者计算了G-交叉函数在0到20毫米之间的面积(AUC0,20mm)。距离范围0到20毫米在分析前根据先前描述的方法选择。


2-4:统计分析

统计分析使用SAS软件(版本9.4,SAS研究所)进行,所有P值均为双侧。作者的主要假设检验了上皮内和间质淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞的密度与癌症特异性生存之间的关联,使用多变量调整的Cox比例风险回归模型。作者使用了严格的单侧a水平0.005来检验零假设(24)。所有其他分析均为次要分析,作者谨慎解释数据,并使用0.005的a水平。

为了评估免疫细胞密度与临床病理特征之间的关系,作者使用了斯皮尔曼相关检验(连续或序数变量)和威尔科克森秩和检验或克鲁斯卡尔-沃利斯检验(分类变量)。作者使用Kaplan-Meier方法估计累积生存概率,并使用对数秩检验比较类别之间的差异。

在分析结直肠癌特异性死亡率时,因其他原因导致的死亡被截断。作者分析了总体死亡率(NHS/HPFS和TCGA)和无进展生存期(TCGA)作为次要结果指标。使用单变量和多变量Cox比例风险回归模型计算了结直肠癌特异性死亡和总体死亡以及无进展生存期的HR和95%置信区间。

在NHS/HPFS队列中,作者使用IPW方法(25-27)来减少由于肿瘤组织可用性引起的选择偏倚,该方法基于4,420例结直肠癌新发病例。生存分析的详细描述在补充表S4中。


Supplementary Table S4 提供了用于生存分析的统计方法的概述。

image-20240807113826014

  1. Kaplan-Meier分析和对数秩检验(Log rank test)

    • 用于可视化根据免疫细胞密度计算的累积生存概率,并比较不同类别之间的差异。
  2. 单变量Cox比例风险回归(Univariable Cox proportional hazards regression)

    • 用于估计癌症特异性生存、总体生存和无进展生存期(Progression-free interval, PFI)的风险比(Hazard Ratio, HR)和95%置信区间(Confidence Interval, CI)。
  3. 多变量Cox比例风险回归(Multivariable Cox proportional hazards regression)

    • 用于在调整潜在混杂因素后,估计癌症特异性生存和总体生存的风险比和95%置信区间。这包括以下几个方面:
      • A. 评估免疫细胞密度(淋巴细胞、浆细胞、中性粒细胞或嗜酸性粒细胞)在上皮内或基质区域的比例性风险假设。
      • B. 在NHS/HPFS队列中,使用4,420例结直肠癌病例,应用逆概率加权(Inverse Probability Weighting, IPW)方法来减少因肿瘤组织可用性导致的选择偏差。
      • C. 在NHS/HPFS队列的次要分析中,评估免疫细胞密度与微卫星不稳定性(MSI)状态在癌症特异性生存方面的统计交互作用。
      • D. 在NHS/HPFS队列中,评估作为潜在混杂因素的协变量,包括性别、年龄、诊断年份、家族史、肿瘤位置、肿瘤分化程度、疾病分期、MSI状态、CIMP状态、LINE-1甲基化水平、KRAS、BRAF和PIK3CA突变状态。
      • E. 在TCGA队列中,多变量Cox回归模型按种族分层,并包括性别、年龄、诊断年份、肿瘤位置、组织学类型和疾病分期。
      • F. 为了比较不同免疫细胞群体的预后价值,构建了一个包括与癌症特异性生存有统计学显著多变量调整关联(Ptrend<0.005)的免疫细胞密度的多变量Cox回归模型。

表中还提到了一些统计分析的细节:

  • 对比例性风险假设进行了评估,使用了生存时间和免疫细胞密度之间的交互项作为时间变化的协变量。
  • 在NHS/HPFS队列中,使用IPW方法来减少由于肿瘤组织可用性导致的选择偏差,并对权重大于95百分位数的值进行了截断,以减少异常值的影响。
  • 在多变量模型中,使用了向后剔除法(Backward elimination)来选择最终模型中的变量,阈值P值为0.05。
  • 对于缺失数据的病例,将其归入给定分类协变量的多数类别,以限制自由度。

这些统计方法为研究者提供了一套工具,用于分析和解释免疫细胞密度与结直肠癌患者生存之间的关系。通过这些方法,研究者可以控制潜在的混杂因素,并评估免疫细胞密度对结直肠癌预后的独立影响。


三、结果

3-1:计算病理学评估免疫浸润

为了在结直肠癌的H&E染色TMA核心中识别中性粒细胞、嗜酸性粒细胞、浆细胞和淋巴细胞,作者进行了自动化玻片扫描和数字图像分析。

自动免疫细胞检测和分类与病理学家以及独立训练的自动化分类器在结果上表现出高度的一致性。在80个肿瘤核心的子集中,自动化方法与手动计数之间的斯皮尔曼等级相关系数(r)分别为淋巴细胞0.95、浆细胞0.74、中性粒细胞0.71和嗜酸性粒细胞0.84(补充图S1A),

image-20240807113955916

而两个独立训练的分类器之间的核心级结果的斯皮尔曼r值分别为淋巴细胞0.96、浆细胞0.74、中性粒细胞0.71和嗜酸性粒细胞0.83(补充图S1B)。

image-20240807114012802

这些结果表明,这些免疫细胞可以通过病理学家监督的机器学习算法可靠地识别。在具有两个或更多可用核心的肿瘤中,两个随机选择的核之间免疫细胞密度的斯皮尔曼r值为淋巴细胞0.56、浆细胞0.43、中性粒细胞0.35和嗜酸性粒细胞0.43(补充图S1C),表明核心间相关性为中等。

image-20240807114030424


3-2:免疫浸润特征与临床病理特征的关系

作者在NHS/HPFS队列中分析了934例结直肠癌的免疫细胞密度(表1)。在这四种免疫细胞类型中,淋巴细胞的总体密度最高,其次是中性粒细胞、浆细胞和嗜酸性粒细胞(图2A)。

image-20240807114136973

“Lymphocyte-IEL”、“Lymphocyte-S”、“Plasma cell-IEL”、“Plasma cell-S”、“Neutrophil-IEL”、“Neutrophil-S” 和 “Eosinophil-IEL”、“Eosinophil-S” 这些术语描述了不同类型的免疫细胞在结直肠癌肿瘤组织中的两种不同位置的状态

  • IEL 表示 “Intraepithelial”,即肿瘤上皮内的位置。
  • S 表示 “Stromal”,指的是肿瘤基质的位置。

具体来说:

  • Lymphocyte:淋巴细胞,涉及适应性和先天性免疫反应。在肿瘤上皮内(IEL)和基质(S)中的密度。
  • Plasma cell:浆细胞,是B细胞的终末分化形式,专门产生抗体。在肿瘤上皮内(IEL)和基质(S)中的密度。
  • Neutrophil:中性粒细胞,是先天免疫系统中的主要效应细胞,参与炎症反应。在肿瘤上皮内(IEL)和基质(S)中的密度。
  • Eosinophil嗜酸性粒细胞,通常与抗寄生虫反应和过敏反应相关,也在肿瘤微环境中发挥作用。在肿瘤上皮内(IEL)和基质(S)中的密度。

这些术语用于区分不同类型的免疫细胞在肿瘤微环境中的空间分布,因为它们的位置可能与肿瘤的生物学行为和患者的临床结果有关。例如,一些研究表明,肿瘤基质中的免疫细胞密度可能与更好的预后相关,而肿瘤上皮内的免疫细胞密度可能有不同的影响。


细胞密度在TMA中保持一致(补充图S2),

image-20240807114347355


根据免疫细胞密度使用UMAP可视化结直肠癌病例时,没有显示出明显的TMA相关或诊断年份相关的影响(补充图S3)。

Figure S3 利用统一流形近似和投影(Uniform Manifold Approximation and Projection, UMAP)分析展示了结直肠癌(colorectal cancer)案例根据肿瘤上皮内(intraepithelial)和基质(stromal)中淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞的密度进行分类的结果。

image-20240807114549592

  1. (A) 根据组织微阵列(TMA)编号的案例着色

    • 此图表明,使用UMAP技术,即使根据TMA编号对案例进行着色,也没有显示出明显的聚类模式。
    • 这意味着不同TMA之间的免疫细胞密度没有显著的空间或结构上的区分。
  2. (B) 根据诊断年份分类的案例着色

    • 类似地,当案例根据诊断年份进行着色时,也没有出现清晰的聚类。
    • 这表明在研究的时间范围内,免疫细胞密度并没有随时间呈现出明显的变化或趋势。
  3. © 根据免疫细胞密度的案例着色

    • 此图着色依据是免疫细胞的密度,显示出具有较高免疫细胞密度的案例通常位于图表的底部区域。
    • 这可能表明免疫细胞密度较高的肿瘤案例在UMAP分析中形成了某种模式或趋势,可能与肿瘤的某些生物学特性或患者的临床结果有关。

UMAP是一种用于降维和可视化高维数据的非线性方法,它能够揭示数据中的结构和聚类。在这项研究中,UMAP用于分析和可视化结直肠癌案例的免疫细胞密度数据。通过这种分析,研究人员能够评估不同肿瘤样本之间免疫细胞分布的异质性,以及这些分布是否与已知的临床或病理特征相关。

如果Figure S3中的图表显示某些区域的案例聚集在一起,这可能表明这些样本在免疫细胞密度方面有共同的特征。相反,如果案例分散在整个图表中,这可能表明免疫细胞密度在样本之间有很大的变异性,并没有明显的聚类趋势。这些发现对于理解肿瘤微环境中免疫细胞的角色以及它们如何影响结直肠癌的生物学行为和治疗响应具有重要意义。


不同免疫细胞类型的密度之间主要是低到中等的正相关;在间质淋巴细胞和间质浆细胞之间观察到的相关性最高(斯皮尔曼r = 0.73;图2B)。

image-20240807114756429


免疫细胞密度与主要肿瘤特征之间的关系总结在图2C中。

image-20240807114820754

肿瘤晚期与间质淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞密度的降低(所有P < 0.001)以及上皮内中性粒细胞密度降低(P = 0.001)相关,而分化不良与上皮内淋巴细胞(P < 0.001)和浆细胞(P = 0.002)密度的增加相关。


考虑到错配修复缺陷在分化不良肿瘤中很常见(28),作者假设这些肿瘤中免疫原性新肽的增加负担(29)可能与更高的免疫细胞密度相关。支持作者的假设,通过MSI-高表型测量的错配修复缺陷与间质淋巴细胞和上皮内淋巴细胞的高密度强烈相关(P < 0.001)。

出乎意料的是,MSI-高肿瘤中上皮内和间质中性粒细胞也更为常见(P < 0.001),而MSI状态与嗜酸性粒细胞或浆细胞密度之间没有明显的强相关性。

上皮内淋巴细胞和中性粒细胞的密度与估计的新抗原负荷呈正相关(P < 0.001)。在肿瘤分子特征中,LINE-1低甲基化与上皮内淋巴细胞密度的降低(P < 0.001)相关,BRAF突变与上皮内淋巴细胞密度的增加(P < 0.001)相关,而PIK3CA突变与间质淋巴细胞密度的增加相关(P = 0.009;补充图S4)。

image-20240807115314198

LINE-1甲基化水平、BRAF、KRAS和PIK3CA基因突变是结直肠癌(colorectal cancer, CRC)中重要的分子标志物,它们与肿瘤的发生、发展、治疗响应和预后密切相关。

  1. LINE-1甲基化水平

    • LINE-1(Long Interspersed Nucleotide Element-1)是基因组中的一种长散在核元件,占人类基因组的约17%。它们是转座元件的一种,可以在基因组中移动和复制。
    • LINE-1的甲基化水平可以影响基因表达和基因组稳定性。在某些情况下,LINE-1的低甲基化与肿瘤发生有关,可能促进转座元件的活性,导致基因组不稳定性增加。
  2. BRAF基因突变

    • BRAF是一种丝氨酸/苏氨酸激酶,属于RAF家族,在细胞信号传导中起着重要作用,尤其是在MAPK/ERK信号通路中。
    • BRAF基因突变通常导致其蛋白产物的持续激活,促进细胞增殖和生存,与肿瘤发展相关。在结直肠癌中,BRAF突变是预后不良的一个指标。
  3. KRAS基因突变

    • KRAS也是一种在RAS/RAF/MEK/ERK信号通路中起关键作用的蛋白,参与调控细胞增殖、分化、存活和凋亡。
    • KRAS基因突变导致其蛋白产物持续激活,是多种肿瘤(包括结直肠癌)中常见的分子改变。KRAS突变与肿瘤的侵袭性和化疗抵抗性有关。
  4. PIK3CA基因突变

    • PIK3CA编码磷脂酰肌醇-3-激酶(PI3K)的催化亚单位,该激酶在细胞生长、存活、代谢和血管生成中起关键作用。
    • PIK3CA基因突变导致PI3K的异常激活,进而激活AKT/mTOR信号通路,促进肿瘤细胞的生长和存活。PIK3CA突变在多种肿瘤中较为常见,包括结直肠癌。

在结直肠癌的研究和临床实践中,这些分子标志物的检测对于理解肿瘤的生物学特性、指导个体化治疗和预测患者预后具有重要意义。例如,某些特定的基因突变可能指示对特定靶向治疗药物的敏感性或抗性。此外,基因突变和甲基化水平的分析还可以揭示肿瘤微环境中免疫细胞浸润的模式,从而为癌症的免疫治疗提供信息。


3-3:生存分析

作者的主要目标是评估上皮内和间质免疫细胞对预后的意义。在截尾病例的中位随访时间12.3年(四分位数范围,8.7-16.3年)期间,共有572例全因死亡,包括290例结直肠癌特异性死亡。

在单变量生存分析(图3和表2;补充图S5)中,间质淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞与更好的癌症特异性生存显著相关(所有P趋势 < 0.001)。

image-20240807115737108

image-20240807115933875

而上皮内淋巴细胞(P趋势 = 0.002)和中性粒细胞(P趋势 = 0.003)也与癌症特异性生存显著相关(补充图S4)。


在多变量Cox比例风险回归模型(表2;补充表S5)中,较高的间质淋巴细胞、浆细胞和嗜酸性粒细胞密度与更长的癌症特异性生存独立于潜在的混杂因素,包括MSI、CIMP、BRAF突变、LINE-1甲基化、肿瘤分期和肿瘤分级。对于嗜酸性粒细胞密度C4与C1,结直肠癌特异性死亡的风险比为0.49(95% CI,0.34-0.71)。

Supplementary Table S5 提供了结直肠癌(colorectal cancer, CRC)中肿瘤上皮内(intraepithelial)和基质(stromal)区域的免疫细胞密度与结直肠癌特异性生存率之间的关系,并且使用了逆概率加权(inverse probability weighting, IPW)方法来进行分析。

image-20240807120422733

  1. 免疫细胞密度:表格列出了不同免疫细胞类型在肿瘤上皮内和基质区域的密度分类(C1至C4),这些分类基于细胞密度的四分位数。

  2. 结直肠癌特异性生存率:表格展示了不同免疫细胞密度与结直肠癌特异性生存率的关系。

  3. 多变量风险比(Multivariable Hazard Ratio, HR):表格提供了调整了其他潜在影响因素后的多变量风险比,这些因素可能包括性别、年龄、诊断年份、肿瘤分化程度、AJCC疾病分期、MSI状态、LINE-1甲基化水平和BRAF突变状态等。

  4. 逆概率加权(IPW):为了减少由于肿瘤组织可用性导致的偏差,研究者使用了IPW方法。这种方法通过估计每个患者组织数据可用性的概率,然后对每个患者进行加权,以调整可能的选择偏差。

  5. 统计显著性:表格中的P值用于评估免疫细胞密度与结直肠癌特异性生存率之间关系的统计显著性。通常,P值小于0.05被认为是统计学上显著的。

  6. 趋势检验(Ptrend):表格还提供了跨免疫细胞密度四分位数的风险比趋势检验的P值,这有助于评估免疫细胞密度与生存率之间是否存在单调趋势。

  7. 其他变量:表格还包括了其他临床病理特征,如性别(NHS和HPFS)、年龄、诊断年份等,这些变量在多变量模型中被调整,以评估它们与免疫细胞密度和结直肠癌特异性生存率的独立关系。

  8. 模型构建:在构建多变量Cox比例风险回归模型时,可能使用了向后剔除法(backward elimination),以选择最终模型中的变量,阈值P通常设为0.05。

通过分析Supplementary Table S5,研究人员可以了解不同免疫细胞在肿瘤微环境中的分布如何影响结直肠癌患者的预后,并识别可能影响生存率的关键因素。这些信息对于开发新的治疗策略和个性化医疗具有重要意义。


作为次要分析,作者考察了间质淋巴细胞、浆细胞和嗜酸性粒细胞与结直肠癌死亡在肿瘤MSI状态分层的生存关联。这些细胞类型的高密度与更好的癌症特异性生存的趋势在MSI状态之间没有显著差异(P交互 > 0.3,补充表S6)。

image-20240807120452653


为了直接比较间质淋巴细胞、浆细胞和嗜酸性粒细胞密度的相对预后价值,作者将这三个变量包含在一个Cox回归模型中,相互调整,并使用阈值P值为0.05的向后消除来选择显著变量(补充表S4)。

分析结果显示,间质淋巴细胞密度(P < 0.001)和间质嗜酸性粒细胞密度(P = 0.011)保持在最终模型中。根据间质淋巴细胞和嗜酸性粒细胞密度的多变量调整后的结直肠癌死亡率风险比见补充表S7。

Supplementary Table S7 比较了结直肠癌特异性生存分析中不同免疫细胞密度的预后能力。

image-20240807120635202

  1. 免疫细胞密度分类:免疫细胞密度被分为四个等级(C1至C4),通常是基于四分位数进行划分,以便于比较不同密度水平对预后的影响。

  2. 风险比(Hazard Ratio, HR):表中列出了不同免疫细胞密度等级的风险比,这是通过Cox比例风险回归模型计算得出的,用于评估具有不同免疫细胞密度的结直肠癌患者死亡风险的相对水平。

  3. 置信区间(Confidence Interval, CI):每个风险比都伴随有一个95%置信区间,这表示了统计估计的不确定性范围。

  4. 趋势检验(Ptrend):表中还提供了趋势检验的P值,用于评估免疫细胞密度从低到高是否与结直肠癌特异性生存风险存在单调趋势。

  5. 模型比较:表中列出了三种不同的模型(Model 1、Model 2和Model 3),这些模型可能包括了不同的变量,用于评估不同免疫细胞密度的预后价值。

    • Model 1:可能包括了淋巴细胞、浆细胞和嗜酸性粒细胞密度的序数量化变量。
    • Model 2:可能是在Model 1的基础上通过向后剔除法(backward elimination)选择变量后的模型。
    • Model 3:可能包括了更广泛的变量,如性别、年龄、诊断年份、家族史、肿瘤位置、肿瘤分化程度、疾病分期、MSI状态、CIMP状态、KRAS、BRAF和PIK3CA突变以及LINE-1甲基化水平等。
  6. 统计显著性:如果HR的95% CI不包含1,通常认为该HR是统计学上显著的,表明免疫细胞密度与结直肠癌特异性生存风险存在显著关联。

  7. 预后能力:通过比较不同模型中HR的大小和置信区间,可以评估不同免疫细胞密度的预后能力。例如,如果某个免疫细胞类型的HR在所有模型中都显著小于1,这可能表明该细胞类型密度较高与较好的预后相关。

  8. 变量选择:在构建最终模型时,可能使用了向后剔除法,以0.05作为P值的阈值,选择对预后有显著影响的变量。

通过分析Supplementary Table S7,研究人员可以确定哪些免疫细胞类型的密度是结直肠癌预后的有力指标,并了解它们如何影响患者的长期生存率。这对于癌症的个性化治疗和预后评估具有重要意义。


3-4:空间分析

鉴于作者能够精确地识别每个免疫细胞的位置,作者探讨了免疫浸润的空间特征与肿瘤细胞的关系是否与患者生存相关。

作者使用了GTumor:Immune cell ®函数(22)来估计样本中任何肿瘤细胞在其指定的r毫米半径内至少有一个特定类型的免疫细胞的可能性。函数在指定的半径r内的AUC受免疫细胞密度(更高的密度导致更高的AUC)和免疫细胞的位置(位于肿瘤细胞附近的免疫细胞导致更高的AUC)的影响。免疫细胞浸润的不同模式及其相应的GTumor:Immune cell图示例在图4A-D中展示。

image-20240807120820638

作者假设反映特定免疫细胞类型高密度聚集在肿瘤细胞附近的GTumor:Immune cell的高AUC将与更好的生存相关。作者进行了单变量和多变量Cox回归分析,使用GTumor:Immune cell AUC0,20mm的四分位数作为输入(图4E-H)。

image-20240807120843652

作者将半径限制在20毫米,以模拟肿瘤细胞和指定免疫细胞之间接近且合理的直接相互作用。分析表明,GTumor:Lymphocyte AUC0,20mm(P趋势 = 0.002)和GTumor:Eosinophil AUC0,20mm(P趋势 < 0.001)的高值都与更好的癌症特异性生存相关,而GTumor:Plasma cell和GTumor:Neutrophil AUC0,20mm的四分位数在具有a = 0.005的多变量Cox回归模型中统计学上不显著。

复合变量Cox比例风险模型共同根据GTumor:免疫细胞和免疫细胞密度对肿瘤进行分类,揭示了不同免疫细胞对肿瘤-免疫细胞接近度和免疫细胞密度的差异性意义(补充表S8)。

Supplementary Table S8 展示了空间 G-cross 测量和免疫细胞密度测量(淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞)与结直肠癌特异性生存率之间的关系。

image-20240807121136258

  1. G-cross 测量:这是一种空间统计方法,用于评估肿瘤细胞与免疫细胞之间的空间关系。G-cross 函数的 AUC0,20µm(Area Under the Curve within 20 micrometers)表示在20微米范围内,肿瘤细胞周围至少有一个指定类型的免疫细胞的概率。

  2. 免疫细胞密度:指的是在肿瘤组织中特定类型免疫细胞的数量,通常以每平方毫米的细胞数来表示。

  3. 组合测量:表中将 G-cross 测量和免疫细胞密度分为高(high)和低(low)两组,以探究它们与结直肠癌特异性生存率的联合效应。

  4. 单变量和多变量 HR:单变量 HR(Hazard Ratio)表示在不考虑其他变量的情况下,某一因素与结直肠癌特异性生存率的关联强度。多变量 HR 则在控制了其他变量(如性别、年龄、诊断年份等)的影响后,评估该因素的独立关联强度。

  5. P 值:用于评估 HR 与1相比是否具有统计学上的显著性。P 值小于0.05通常被认为是统计学上显著的。

  6. 趋势:表中可能还展示了不同组合测量与结直肠癌特异性生存率之间趋势的 P 值(Ptrend),这有助于了解随着免疫细胞密度或 G-cross 测量值的增加,生存率是否有单调的趋势变化。

  7. 预后因素的交互作用:通过分析 G-cross 测量和免疫细胞密度的组合效应,可以更深入地了解这些因素如何共同影响结直肠癌患者的预后。

  8. 模型构建:多变量 Cox 回归模型可能包括了一系列预后因素,并通过向后剔除法选择最终模型中的变量。

  9. 免疫细胞类型:表中分别对淋巴细胞、浆细胞、中性粒细胞和嗜酸性粒细胞进行了分析,以评估它们在结直肠癌预后中的潜在作用。

通过分析 Supplementary Table S8,研究人员可以更好地理解肿瘤微环境中免疫细胞的空间分布和密度如何影响结直肠癌患者的预后,并可能识别出新的治疗靶点或预后生物标志物。

例如,淋巴细胞密度和与肿瘤细胞的接近度都对更好的癌症特异性生存有贡献,而仅对浆细胞,密度对更好的癌症特异性生存有贡献。


3-5:验证队列

作者分析了TCGA中的一个独立验证队列,包含570例结直肠癌病例(补充表S2)。与NHS/HPFS队列相比,该队列的生存数据受到随访时间短和事件数量低的影响,特别是在癌症特异性生存分析中(19)。

在癌症特异性生存分析中,在截尾病例的中位随访时间1.8年(四分位数(IQR,1.1-3.0年)期间,共有75例事件;在整体生存分析中,在截尾病例的中位随访时间1.8年(IQR,1.1-2.9年)期间,共有120例事件;在无进展生存期分析中,在截尾病例的中位随访时间1.7年(IQR,1.0-2.8年)期间,共有151例事件。

与NHS/HPFS队列的结果一致,在多变量Cox比例风险回归模型中,高间质嗜酸性粒细胞密度与更长的癌症特异性生存、整体生存和无进展生存期相关(所有P趋势 < 0.001)(补充表S9)。

image-20240807121506039


对于间质嗜酸性粒细胞密度C4与C1,结直肠癌特异性死亡的风险比为0.21(95% CI,0.10-0.47)。间质淋巴细胞密度C4与C1的点估计值接近NHS/HPFS队列的结果(癌症特异性生存:HR 0.55,95% CI,0.28-1.09;整体生存:HR 0.74,95% CI,0.44-1.25;无进展生存期:HR 0.61,95% CI,0.37-1.00),尽管在a = 0.005的水平上统计学上不显著。

高上皮内嗜酸性粒细胞密度也与更长的整体生存期(P趋势 < 0.001)和无进展生存期(P趋势 < 0.001)相关,而上皮内淋巴细胞密度则与更长的无进展生存期相关(P趋势 = 0.009)。上皮内或间质浆细胞或中性粒细胞的密度与生存期在a = 0.005的水平上无显著关联。

与NHS/HPFS队列一致,高GTumor:Eosinophil AUC0,20mm与更长的整体生存期(P趋势 < 0.001)和无进展生存期(P趋势 < 0.001)相关,而高GTumor:Lymphocyte AUC0,20mm也与更长的无进展生存期相关(P趋势 = 0.002;补充表S10)。

image-20240807121807742


四、讨论

在本研究中,作者利用两个大型美国前瞻性队列研究以及TCGA中的570例结直肠癌的独立队列,评估了计算表型免疫细胞在结直肠癌肿瘤微环境中的预后意义。

作者的主要发现表明,肿瘤间质中淋巴细胞和嗜酸性粒细胞的高密度与更好的生存相关,独立于潜在的混杂因素。这些结果支持了机器学习评估免疫细胞浸润作为结直肠癌预后工具的潜力,并识别了以前未充分重视的免疫细胞亚群,这些亚群在结直肠癌中具有预后相关性。


淋巴细胞

淋巴细胞是一组异质性的细胞,既参与适应性免疫(T细胞、B细胞)也参与固有免疫(自然杀伤细胞),并参与多种免疫调节和效应功能,包括细胞因子产生(T细胞、B细胞、NK细胞)、抗原呈递(B细胞)、细胞毒性(细胞毒性T细胞和NK细胞)以及免疫记忆(记忆T细胞和B细胞)。

CD3+和CD8+ T细胞的高密度被认为是结直肠癌的有前景的有利预后标志(8),并且有证据表明,MS4A1+(CD20+)B细胞的高密度也与更长的生存期相关(30)。H&E染色评估无法区分不同类型的淋巴细胞。然而,作者发现高间质淋巴细胞密度与较低的癌症死亡率密切相关,独立于MSI状态和其他潜在的混杂因素。


浆细胞是专门从事抗体产生的终末分化B细胞。

在一项包含557例I-IV期结直肠癌患者的研究中,Berntsson等人发现,高SDC1+(CD138+)浆细胞密度与结直肠癌的生存期相关,但在多变量Cox回归模型中不相关

然而,其他研究评估了浆细胞与结直肠癌生存期的关系的研究很少。在作者的研究中,NHS/HPFS队列的结果支持了高间质浆细胞浸润与更好的癌症特异性生存的相关性,而TCGA验证队列则未支持这一关联。


中性粒细胞是固有免疫的主要效应细胞,代表了对微生物感染的初步防御。

新兴证据表明,中性粒细胞通过多种机制包括细胞毒性、释放炎症介质、生长因子和蛋白酶来增强或抑制肿瘤进展,招募到人类肿瘤。

在结直肠癌中,几项研究利用CEACAM8(CD66b;参考文献34-36)或MPO(37)来检测中性粒细胞,报告了高中性粒细胞密度与更好的生存相关。值得注意的是,这些标记并非中性粒细胞的特异性标记,因为CEACAM8也表达于嗜酸性粒细胞,MPO也表达于某些巨噬细胞。

为了克服这一局限性,在一项最近的研究中,中性粒细胞是根据其形态在H&E染色切片中手动计数识别的。尽管该研究无法证明中性粒细胞密度与整体生存期之间的统计学显著关联,但样本量有限(221例I-IV期结直肠癌患者)。

在作者的研究中,中性粒细胞也是通过其在H&E染色图像中的形态来识别的。NHS/HPFS队列的分析支持了高上皮内和间质中性粒细胞密度与更好的整体生存相关(P趋势 < 0.001和P趋势 = 0.003, respectively),尽管在a水平为0.005的癌症特异性分析中未达到统计学显著性(上皮内,P趋势 = 0.012;间质,P趋势 = 0.034),或TCGA验证队列。


嗜酸性粒细胞是固有免疫细胞,在抵御寄生虫感染中起着核心作用,也参与过敏和哮喘的发病机制。

与中性粒细胞类似,嗜酸性粒细胞可以通过其在H&E染色切片中的形态可靠地识别,正如作者的研究所做的那样。

几项早期研究发现了结直肠癌中嗜酸性粒细胞密度较高与更好的生存相关(41, 42)。作者的研究,利用了两个美国前瞻性队列研究的大样本,以及TCGA,支持了高间质嗜酸性粒细胞密度与更好的癌症特异性生存和整体生存的相关性。这一发现与最近在小鼠结直肠癌模型中的实验证据一致,该模型显示嗜酸性粒细胞具有抗肿瘤作用(43)。

作者利用机器学习基于的图像分析来检测H&E染色切片中具有独特形态的四个免疫细胞类型。在过去的几年里,这种方法在分析组织病理学图像方面得到了越来越多的应用。许多广泛使用的深度学习方法使用像素块(如100×100像素)作为输入(44, 45),而作者所使用的方法包括单独的细胞检测(基于细胞核的高血染光学密度)和分类(基于形态学特征)的步骤。

作者使用了QuPath,一个开源软件,该软件已被广泛适应和验证用于数字病理图像分析(20, 46, 47)。作者的方法在手工计数(斯皮尔曼等级相关系数r = 0.71-0.95)和两个独立训练的分类器之间的可重复性(斯皮尔曼等级相关系数r = 0.71-0.96)方面取得了良好的到优秀的准确度,这取决于细胞类型。

检测淋巴细胞和嗜酸性粒细胞的能力优于检测浆细胞和中性粒细胞,这可能与浆细胞与其他细胞类型的形态学差异较大,以及区分仅部分可见的核分叶的中性粒细胞、区分中性粒细胞与凋亡核碎片和有丝分裂有关的问题有关。机器学习定量的一个特别优点是所有图像都使用相同的标准进行了评估,从而提高了数据的一致性。


作者的数据格式还使作者能够分析免疫细胞浸润的空间特征与肿瘤细胞的关系。

作者利用GTumor:Immune cell ®函数来近似肿瘤细胞在其指定的r毫米半径内有一个免疫细胞邻近者的概率。

作者假设与肿瘤细胞附近的免疫细胞高密度聚集相关的高GTumor:Immune cell AUC0,20mm将与其更好的结果相关,并且这种关联在可能对肿瘤细胞具有细胞毒性作用的细胞类型(包括淋巴细胞、中性粒细胞和嗜酸性粒细胞)的分析中更为明显,尽管这种关联可能不适用于GTumor:Plasma cell分析,因为潜在的抗肿瘤抗体产生不需要与肿瘤细胞密切接触。

作者观察到,淋巴细胞和嗜酸性粒细胞的高AUC0,20mm与更长的生存期在多变量调整后具有统计学显著的关联。这一关联在TCGA验证队列的嗜酸性粒细胞中也得到了观察。

然而,在NHS/HPFS队列中,GTumor:Eosinophil C3类别并没有显示出向更好预后趋势的趋势,其原因尚不清楚。肿瘤-免疫空间相互作用的许多潜在方法尚待探索,以改善预后分类的最优方法需要进一步研究。


在解释作者的结果时,需要考虑几个限制。

首先,癌症治疗的信息缺失。然而,治疗主要是基于疾病阶段而不是肿瘤-免疫浸润,作者在生存分析中调整了疾病阶段。

其次,作者评估了多个假设。然而,作者使用了严格的a水平0.005来提高可重复性和减少假阳性发现(24)。

第三,NHS/HPFS队列的分析是在使用TMA进行的,而TMA格式中每个肿瘤的小面积可能无法完全代表整个肿瘤区域的免疫细胞浸润。然而,许多研究已经生成了使用TMA的重复性结果(50)。

此外,大多数肿瘤检查了多个TMA核心图像(平均每个肿瘤3.2个核心)。由于TMA核心的肿瘤区域选择没有特别关注免疫细胞浸润,因此使用TMA格式可能导致的任何测量误差都可能将作者的结果推向零假设。此外,TMA使作者能够研究超过900个肿瘤,提高了免疫细胞检测的准确性。

第四,TMA只包括肿瘤中心的核,无法检查侵袭边缘和三级淋巴样结构的免疫细胞浸润,这两者都被报道具有预后意义(7, 8, 10)。


本研究的优势包括NHS/HPFS队列中潜在混杂因素的全面数据集,如家族结直肠癌史、MSI状态、CIMP、LINE-1甲基化和BRAF突变状态,这些因素都包含在生存分析中。

然而,一些临床相关的数据元素不可用,如肿瘤芽生、NRAS状态和Lynch综合征史。此外,研究人群基于美国的大规模医院,这有利于结果的推广性。同时,同时检查多种免疫细胞类型使作者能够比基于单一细胞类型的分析获得更细致的结直肠癌组织微环境的视图。

综上所述,作者的结果支持了机器学习基于H&E染色切片评估免疫细胞浸润作为结直肠癌预后参数的潜力。特别是,肿瘤间质中嗜酸性粒细胞的高密度与有利的预后相关

结果还表明,免疫细胞浸润与肿瘤细胞的空间模式蕴含着生物学和预后相关的信息。

  • 15
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值