Nature | 华大携手瑞典乌普萨拉大学发表地表最大规模结直肠癌多组学研究(结直肠癌的预后基因组和转录组特征)


–https://doi.org/10.1038/s41586-024-07769-3

留意更多内容,欢迎关注微信公众号:组学之心

大佬们新出的nature,我得赶紧学习一下(抱拳)

Prognostic genome and transcriptome signatures in colorectal cancers

研究团队和研究单位

林从 & 吴逵:HIM-BGI Omics Center / Guangdong Provincial Key Laboratory of Human Disease Genomics / Institute of Intelligent Medical Research (IIMR)

Tobias Sjöblom & Bengt Glimelius:Department of Immunology, Genetics and Pathology, Science for Life Laboratory, Uppsala University

研究简介

研究背景

约 20% 的结直肠癌 (CRC) 患者在诊断时已患有转移性疾病,另有 20% 的患者将在以后疾病进程中发生转移。结直肠癌是由一系列体细胞基因组变异引起的,这些变异会影响核心癌症通路中的驱动基因。

从外显子组和全基因组测序来看,CRC 的突变景观在编码区最为明显,而非编码区仍未得到充分研究。约 80-85% 的 CRC 被归类为拷贝数改变的微卫星稳定 (MSS),10-16% 被归类为高度突变且微卫星不稳定性 (MSI),1-2% 被归类为由体细胞 POLE 突变导致的超突变。

MSI 状态可预测对检查点抑制剂的反应,而 KRAS、NRAS 和 BRAF 突变则可预测对 EGFR 靶向疗法的反应不佳。WNT、EGFR–KRAS–BRAF、PIK3CA、TGFβ 和 p53 通路受 CRC1 突变调控,这些通路中的几种驱动基因突变与预后有关。

研究内容

研究分析了长期随访人群中的 1,063 个原发性结直肠癌的全基因组和转录组数据。

①在 96 个突变驱动基因中,发现 9 个基因之前与结直肠癌无关,24 个基因与任何癌症都无关。研究中观察到两种不同的通路共突变模式,并通过时序分析确定了9个早期驱动基因突变和3个晚期驱动基因突变。

②研究确定了几种结直肠癌特异性的突变过程特征。研究发现,WNT、EGFR 和 TGFβ 通路基因、线粒体 CYB 基因、3 个调控元件的突变以及 21 个拷贝数变异和 COSMIC SBS44 特征与生存期相关。

③基因表达分类产生了五种具有不同分子特征的预后亚型,其中包括不同的基因组改变。此外,微卫星不稳定肿瘤可分为两类,它们具有不同的缺氧水平和免疫细胞及基质细胞浸润。

此研究是迄今为止结直肠癌最大的综合基因组和转录组分析,将突变、基因表达和患者结果相互关联,为未来个性化结直肠癌治疗提供了重要指导。

研究结果

1.CRC突变景观

样本大致情况:

研究从 1126 例 CRC 病例的 1063 例中获得了高质量的全基因组测序数据,以及肿瘤转录组测序数据。

其中,943 例为原发性肿瘤手术标本,120 例为原发性肿瘤活检标本。522 例的对照样本取自外周血,541 例的对照样本取自邻近组织,没有引入批次效应。

所有患者中的126 例(12%)在手术获取肿瘤标本之前已接受过预处理,其中 92 例样本为手术前接受过放化疗或放疗的直肠癌。

对 1063 个 CRC 基因组进行体细胞突变分析,确定了 96 个驱动基因

研究总共鉴定出 96 个突变驱动基因,1,056 个(99%)肿瘤至少在其中一种基因中发生体细胞突变。最左边的橙色基因是以前未在 CRC 中鉴定为驱动基因(本研究认为是),蓝色基因是没有在任何癌症中鉴定为驱动基因的。

  • 蓝色:与BMP (RGMB) 和 EGFR (AREG) 信号传导、细胞周期 (CEP170 和 SKA3)、免疫系统 (PIGR 和 CSF3)、离子转运 (SLC12A2 和 CYB561A3)、代谢 (PIGW、CYP2A6 和 CYP7B1)、mRNA 剪接 (SREK1IP1)、蛋白质转运 (WASHC2C 和 SLC46A3)、转录调控 (FOXP2、NANOGP8、TBP 和 ZNF554)、核糖体蛋白 (RPS15、RPS16 和 RPS6) 和其他途径 (CBWD1、PRAC2 和 ANKRD40) 有关。

  • 橙色:与免疫系统 (CDH1)、组蛋白修饰 (SETD5)、转录调节因子 (MIDEAS 和 NONO)、PI3K 信号传导 (TYRO3)、细胞反应 (FLCN)、核糖体蛋白 (RPL10 和 RPL22) 和 UCH 蛋白酶 (MBD6) 有关。

红绿渐变部分的多因素Cox分析显示出高突变(HM)和非高突变(nHM)CRC 与驱动基因在生存(HR)上的关联,红色代表与癌症OS/RFS风险较高相关,绿色反之。

绿色渐变部分的Fisher 精确检验显示在不同受影响的肿瘤比例中,驱动基因与临床和基因组特征的关联。*代表 FDR<0.05。

此外,基因突变类型和发生频率显示在右侧,包括受影响通路的描述。在 HM 肿瘤中,超过 20% 的病例发生突变的基因属于 TGFβ–BMP、WNT、RTK–RAS、核糖体蛋白、表观遗传调控、PI3K、SCF 复合物、p53 和免疫系统途径,最常见的复发性突变是 ACVR2A (p.K437Rfs5; 78%)、BRAF (p.V600E; 65%) 和 RNF43 (p.G659Vfs41; 57%)。相应地,超过 10% 的 nHM 肿瘤中 WNT、p53、RTK–RAS、PI3K、SCF 复合物和 TGFβ 途径的基因发生突变。 nHM 肿瘤中最常见的热点突变是 KRAS p.G12D (15%) 和 p.G12V (11%)。

(b)图展现每个肿瘤中总突变(蓝色)和非同义突变(红色)数,以及若干临床特征和选定基因的突变状态。灰色线标识了高突变(HM)和非高突变(nHM)的分界线,兆碱基突变数 > 23.16认为是HM,可见HM大部分是微卫星不稳定的状态(MSI)。与非高突变(nHM)病例相比,HM 病例年龄较大,女性患者较多,右侧肿瘤、粘液性肿瘤、高级别肿瘤(低分化或未分化肿瘤)和 II 期肿瘤较多。此外,POLE、POLD1、PIK3CA和BRAF突变是驱动的往往发生在HM中。

(c)图展现的是HM肿瘤中具有 POLE 或其他 DNA 损伤修复基因突变的 MSS 15个病例,其中 6 个是具有高非编码肿瘤突变负担 (TMB) 但没有修复基因突变的 MSS。HM MSS 肿瘤中的修复基因突变并非都是驱动因素;因此,它可能无法完全解释它们为什么高 TMB。

96 个结直肠癌驱动基因中的互斥基因突变和共生基因突变以高突变状态显示

(a)确定了两种不同的 RTK-WNT 通路共突变模式——(1) KRAS、APC 和 AMER1,以及 (2) BRAF 和 RNF43。对于 KRAS、APC 和 AMER1 组,nHM 肿瘤具有共存的 PIK3CA和 TCF7L2以及互斥的 TP53和 NRAS突变。

(b)在 BRAF 和 RNF43 肿瘤中,在 HM 肿瘤中观察到 ACVR2A的共生突变,在 nHM 肿瘤中观察到 AKT1和 TYRO3的共生突变。在 TGFβ 通路中,在 nHM 肿瘤中发现 SMAD2 和 SMAD3的共生突变,而在 HM 病例中 TGIF1 与 PIK3CA共生。 HM 肿瘤在 B2M 和 HLA-A 中存在相互排斥的突变,在 KMT2B 和 CD58 中存在共发生突变以及 ERBB3 中存在共发生突变。

总的来说,研究确定了 33 个额外的 CRC 驱动因素以及 CRC 通路内和跨 CRC 通路中之前未确定的共突变模式。

2.结构变异(SV)和时序分析

为了涵盖 CRC 进展中的所有类型的基因组事件,研究汇编了CRC拷贝数变异 (CNV) 和结构变异 (SV)。图中驱动基因中的CNVs基因按类型显示:等位基因杂合性缺失 (LOH)(绿色)、基因缺失(黄色)和基因扩增(红色)。条形高度与具有相应改变的肿瘤分数成正比。91个常染色体驱动基因分别表示为致癌基因(O;紫色)、肿瘤抑制基因(S;橙色)、两者都有(S、O;红色)或作用不明的基因(黑色),并按基因组位置显示。其中最常见的染色体臂畸变是约 50% 的肿瘤中 7p 和 20q 的增加,以及超过 40% 的 17p、18p 和 18q 的LOH。

这些信息对于开发针对这些突变的治疗方法具有重要意义。

在 nHM(左)中发现的新型局灶性 CNV 包括 15q24.3 (25%) 的缺失(包含 MIR3713)、22q12.3 (24%) 和 8p11.22 (19%) 的缺失(包含 ADAM 家族蛋白酶基因)。

nHM 中基因 CNV 的频率高于 HM (右),平均影响 55% 的驱动基因,而 HM 中为 11%。最常受 CNV 影响的驱动基因是 GNAS 和 ASXL1,其中 82% 和 81% 的 nHM 有增益和/或扩增,而 SMAD4(79%)、SMAD2(77%)和 TP53(76%)有更多的缺失和 LOH。

在 HM 中,抗原呈递基因 HLA-B(26%)、HLA-A(25%)和 TAP2(24%)的 LOH 频率最高,而 TRPS1(26%)、ACVR1B(22%)、CYP7B1(22%)、MBD6(22%)和 ERBB3(22%)的增益频率最高。

上面箱线图展现了SV事件数目在临床特征中的分布情况,其中缺失是最常见的 SV,主要发生在中晚期肿瘤中,在 I 期肿瘤中较少。易位在老年患者以及 HM、MSI和晚期肿瘤中更常见。相比之下,倒位和串联重复序列在 HM、MSI和右侧结肠肿瘤中不太常见。

上图展现了SV类型在整个基因组中的情况,一半驱动基因 SV 是缺失(黄色线),最常影响肿瘤抑制基因(橙色),如 RUNX1(n = 38)、PTEN(n = 33)和 SMAD3(n = 30)。最常受影响的 DNA 修复基因是 RAD51B (n = 33)。

(a)在 250 个肿瘤(24%)中观察到染色体外 DNA (ecDNA),其中 91% 为 nHM。上图展示的是在非超突变(左列)和超突变(右后 4 列)肿瘤中观察到的带有 ecDNA 扩增子的 50 个前致癌基因的 Oncoplot图,左侧显示了含有致癌基因的 ecDNA 的肿瘤比例。按类型显示了每种肿瘤(顶部)和每种致癌基因(右侧)的 ecDNA 扩增子数量。在 87 个(35%)ecDNA+ 病例中发现了环状扩增子,最常包含的致癌基因是 ERBB2(n = 9;10%)、FLT3(n = 7;8%)、CDX2(n = 7;8%)、CDK12(n = 5;6%)和 MYC(n = 5;6%)

(b)在一项泛癌症研究中,肿瘤 ecDNA 与较短的生存期相关,但未观察到 ecDNA 类型依赖的总生存期 (OS) 或无复发生存期 (RFS) 差异。

CRC 进化过程中的基因组事件序列此前尚未在大量 nHM 肿瘤中确定。上图是PhylogicNDT 时序分析 801 nHM CRC 肿瘤中驱动基因突变和 SV 的发生和相对时间。早期/克隆性突变(绿色)、中期(黑色)和晚期/亚克隆(紫色)改变。WGD是全基因组复制。

这里最早的事件是 APC、TP53、KRAS、BRAF 和 ZFP36L2 的体细胞突变,其次是 TCF7L2、FBXW7、BCL9L 和 SOX9 以及 17p 和 18 号染色体的丢失。其中,(1) TP53 和 17p 丢失是已知的早期突变,常见于多种癌症中;(2) APC、KRAS、BRAF 和 TP53 突变驱动 CRC 发展; (3) ZFP36L2、TCF7L2、BCL9L 和 SOX9 是癌症中以前未知的早期事件。晚期或亚克隆事件包括全基因组复制、1q、6p、9p、12、16p、17q 和 19q 的增加以及 TRPS1、GNAS 和 CEP170 的突变。

总的来说,这些发现为早期检测和与 CRC 侵袭和转移可能相关的事件提供了策略。

3.突变特征

CRC 中的突变特征与衰老、错配修复 (MMR) 缺陷、聚合酶校对、大肠杆菌素暴露和未知病因有关。

在这里,研究从头分析确定了 27 个单碱基替换 (SBS)、8 个双碱基替换 (DBS) 和 11 个小插入和缺失 (ID) 特征。在 27 个 SBS 特征中,25 个分解为 32 个 COSMIC SBS 特征27。

在 17 例肿瘤中发现了一种新的标记,称为 SBS-CRC1,均为 MSI 或 POLE 突变,与有缺陷的 DNA MMR SBS15 标记相关。在 17 例早期和 MSS 肿瘤中观察到另一种新的标记,即 SBS-CRC2,与病因不明的 SBS12828 标记相关。其中,具有 DNA MMR SBS44 特征的 HM 肿瘤主要为右结肠和 BRAF V600E 突变,较少见于 IV 期且 OS 更长。(还需要见补充表12和13)

在 8 个 DBS 特征中,3 个可以分解为 6 个 COSMIC DBS 特征。新的 DBS-CRC3 特征具有最高的体细胞突变密度,发生在 98% 的 MSI 病例中。缺陷的 DNA MMR 特征 SBS15 和 SBS44 与 DBS-CRC3 高度相关,这与之前描述的 MMR 缺陷特征 DBS19 相似。与 MSS POLE 突变肿瘤相关的特征 SBS10a 和 SBS10b 与 SBS2829和新的 DBS-CRC5 特征同时出现。(还需要见补充表14)

从 11 个 ID 特征中,9 个分解为 9 个 COSMIC ID 特征,其中最常见的 ID1(87%)和 ID2(98%)与复制过程中的 DNA 滑移有关。值得注意的是,新的 ID-CRC1 特征具有最高的体细胞突变密度(每 Mb >10 个突变),89% 的 ID-CRC1 病例还具有缺陷的 DNA MMR 特征 SBS44。(还需要见补充表12和13)

上图展现每个突变特征图展示了结直肠癌中不同类型的突变频率和分布,其中:

  • Y轴显示单碱基替换突变/双碱基替换突变/插入和删除突变的百分比
  • X轴彩色带显示特定碱基对的替换类型/特定碱基对的双碱基替换类型/特定长度的插入或删除类型
  • Stability表示该突变特征的稳定性
  • Sig. Mutations表示显著的突变数量和百分比。

47 个已知突变特征和 9 个以前未知的突变特征,其中 SBS28 和 DBS-CRC5 与 POLE 突变 MSS CRC 相关,SBS-CRC1、DBS-CRC3 和 ID-CRC1 特征与 MMR 相关,DNA MMR SBS44 特征与 HM 肿瘤中的 OS 较长。

4.线粒体基因组

结直肠癌(CRC)患者的线粒体DNA (mtDNA) 有以下两个显著特征:

  • 高中位拷贝数:线粒体DNA的拷贝数指的是每个细胞中线粒体DNA的数量。在CRC中,线粒体DNA的中位拷贝数较高,这意味着在CRC患者的细胞中,线粒体DNA的数量普遍较高。这可能意味着结直肠癌细胞需要更多的线粒体来支持其快速增殖和高代谢需求。线粒体在细胞能量供应、代谢和细胞凋亡中起着重要作用,高拷贝数可能有助于癌细胞的生存和生长。

  • 截断突变的富集:截断突变(Truncating Mutations)是指那些会导致蛋白质合成提前终止的突变。这种突变通常会导致蛋白质功能的丧失。富集表示在CRC患者的mtDNA中,截断突变出现的频率较高,比正常情况下的频率要高。这表明在结直肠癌中,mtDNA更容易发生导致功能丧失的突变。这些突变可能影响线粒体的正常功能,包括能量代谢、氧化应激反应等。这种富集可能与癌症细胞的代谢重编程有关,可能会使癌细胞适应肿瘤微环境中的压力。

研究在 1,027 个 (97%) 肿瘤中鉴定出 3,982 个单核苷酸变异 (SNV) 和 949 个 mtDNA 插入/缺失突变。mtDNA 突变最常见于非编码启动子 D 环 (48%) 和复合体 I 基因 ND5 (41%) 和 ND4 (30%)。截断突变在 ND5 和 ND4 中富集,分别占突变的 35% 和 29%。

与其他癌症类型一样,与沉默突变和截断突变相比,错义 mtDNA 突变更常见于近同质性(变异等位基因频率 (VAF) > 60%),并且它们在不同 VAF 下的总体 dN/dS 比率接近 1。6.6% 的肿瘤发生 VAF > 60% 的截断突变,而其他癌症中这一比例为 ❤️%,这表明线粒体失调对 CRC 肿瘤发生很重要。

虽然 HM 状态与 mtDNA 突变计数无关,但诊断年龄相关(d)。mtDNA 突变之间共现但不互斥(e)。

右结肠、偏向晚期和 HM 肿瘤中的线粒体基因组拷贝数 (mtDNA-CN) 较低(a)。当分为低(n = 127)和高(n = 912)肿瘤 mtDNA-CN 组时,高 mtDNA-CN 病例的 OS 有更长的趋势(b-d)。mtDNA-CN 与时钟样(SBS1 和 SBS5)和 ROS(SBS18)SBS 特征呈正相关,但与大多数 MMR 特征呈负相关(e-g)。

5.对预后的影响

与临床试验、转诊医院或积极治疗患者的队列相比,该队列患者年龄更高,右侧肿瘤更常见,MSI 病例比例更高,导致不同的预后队列特征。与瑞典所有手术切除的 CRC 相比,直肠、I 期和 IV 期肿瘤的代表性略低,但 OS 相似。

该队列代表了瑞典切除的 CRC 患者群体,因此也代表了西方人群。与 MSI 病例相比,MSS 病例的 RFS 更短,而未经治疗的 IV 期 MSI 病例与 MSS 病例相比 OS 更短。年龄 >80 岁的患者以及高级别和晚期肿瘤患者的 OS 和 RFS 最差。对于未经治疗的 I-III 期病例,直肠或左结肠肿瘤位置与较长的 OS 相关,但与 RFS 无关。右侧结肠肿瘤仅与接受一线化疗而未进行转移灶切除术的 IV 期病例的 OS 较短相关。

(另见补充表 18和19)根据 994 名(94%)具有 5 年生存数据的患者,其中 219 名(22%)患有 HM CRC,研究确定了与 OS 或 RFS 相关的突变驱动基因。

在 nHM 组中,APC 突变与较长的 OS和 RFS相关,MT-CYB 突变与较长的 OS 和 RFS相关,SIN3A 突变与较长的 OS 相关。ARHGAP5、BRAF33 和 RNF4334 突变与较短的 OS和 RFS相关,ARID2 突变与较短的相关。相比之下,携带 ARHGAP5、RNF43 和 TGFBR2 突变的 HM 病例的 RFS 更长,而 BCL9 和 TRPS1 与 OS 较短相关,PCBP1 与 RFS 较短相关。

(另见补充表20和21)研究分析了 nHM 肿瘤中的候选顺式调控元件 (cCRE),并确定了 7 个近端增强子样、1 个启动子样、7 个 DNase 特异性和 11 个 CTCF 特异性元件以及 34 个差异表达相关基因。在表达失调的基因中,ID2 和 HS3ST1 的调控元件突变与较短的 OS 相关,DAPK1 与较短的 RFS 相关。靶向 ID2 可降低体内 CRC 生长,其表达在缺氧条件下通过 WNT 信号传导增加,DAPK1 缺失与 CRC 细胞的侵袭性相关,支持它们在 CRC 发病机制中的作用。

(另见补充表22和23)nHM 肿瘤中的预后 CNV 包括已知事件,例如 20q11.1、20q11.21 和 20q13.33 的扩增以及 16p13.3 的缺失,以及未知事件,其中扩增与较长生存期相关,而缺失与较短生存期相关。对于 HM 肿瘤,研究确定了与较短生存期相关的五个预后 CNV,包括已知的 −4q22.1 事件。 SMAD4 缺失的 nHM 肿瘤患者的 RFS 较短,而 TCF7L2 易位的 nHM 肿瘤患者的 OS和 RFS较短。

总之,研究观察到 12 个已知癌症基因、21 个 CNV、1 个线粒体基因和 3 个调控元件突变与预后的相关性。

6.驱动基因和融合基因的表达情况

CRC 信号通路中体细胞改变和基因表达水平的综合分析

图中显示了nHM 和 HM 肿瘤中每个基因的体细胞变异频率,包括突变和拷贝数 (CNV) 丢失和增加。红色 (log2(FC) > 0) 和蓝色 (log2(FC)< 0) 颜色强度表示突变和野生型肿瘤之间按体细胞变异类型 (nHM 和 HM 样本的突变、CNV 增加和 CNV 丢失) 进行对数转换的 FC。体细胞变异频率由每列中的黑线表示。黑点显示基因表达变化,FDR 调整后的 P < 0.05。驱动基因以橙色边框标记。

其中,RTK-RAS、PI3K、p53 和 TGFβ 通路基因 EGFR、KRAS、PIK3CA、CDKN2A、TGFBR1 和 ACVR2A 的肿瘤突变与基因表达增加有关,而 APC、PTEN 和 TP53 的突变在 nHM 和 HM 肿瘤中均有表达降低。

尽管无义介导的衰变会使差异基因表达水平的解释变得复杂,但在 WNT 通路驱动基因中,RNF43、AXIN2、SOX9、ZNRF3、CTNNB1 和 AMER1 在肿瘤中的表达高出 55-334%,而 TCF7L2、APC 和 CTNND1 在未受影响的对照结直肠组织中的表达高出 15-24%。(另见补充表24,25)

96 个驱动基因的基因表达水平

具有 SOX9 或 TCF7L2 突变的肿瘤相应基因的表达增加,而其他突变的 WNT 通路驱动基因的肿瘤表达降低。与野生型肿瘤和仅携带一个基因突变的肿瘤相比,具有 RTK/WNT 通路 BRAF 和 RNF43 共突变的肿瘤具有更高的 BRAF 表达和更低的 RNF43 表达。与突变相关的表达降低表征了与抗原呈递(HLA-A、B2M 和 CDH1)、转录调控(ASXL1 和 NONO)、细胞凋亡(BAX)、组蛋白修饰(KMT2B)和核糖体功能(PPL22)相关的几个基因。

结直肠癌预后亚型(CRPS)的体细胞突变和拷贝数变异

(a)共 621 个融合转录本在 338 个 nHM(41%)和 78 个 HM(32%)肿瘤中表达,其中 17 个是反复出现的。

(b)最常见的融合基因是 PTPRK(n = 27 个肿瘤)、RSPO3(n = 25)、SEPTIN14(n = 24)、FBXO25(n = 24)和 FBRSL1(n = 19)。

(c-d)在这些融合中,有 15 种是已知的 CRC 驱动因素,包括 NTRK、BRAF 和 ERBB2 融合、已证明促进分化和干性丧失的 PTPRK–RSPO3 融合,以及未表征的 FBXO25–SEPTIN14 融合。

7.预后基因表达特征

突变和转录数据可用于开发癌症子类型分类器,定义底层基因组事件对分类的贡献。目前共识分子亚型 (CMS) 分类系统是最先进的基于基因表达的 CRC 分类,但由于大多数 CRC 在反卷积时由几种 CMS 亚型组成,因此需要一种单细胞分辨率 (iCMS) 的精细分类来进一步细挖异质性。

由于 CMS 是基于不同技术生成的 18 个数据集,研究在这里检查了此处病例的无监督从头分类能否复现出 CMS 或 iCMS。

CRPS分型和CMS分型的对应关系

图中展示了不同CRPS亚型与CMS亚型的对应关系,并通过桑基图的流动线条展示了如何从一种亚型转换到另一种亚型。

CRPS亚型(左侧):

  • CRPS1 (28%):主要与CMS1对应,具有高频的微卫星不稳定性(MSI)和高突变率,BRAF和PIK3CA基因突变,免疫基因突变,伴随免疫细胞浸润和激活。
  • CRPS2 (28%):主要与CMS2和CMS4对应,CMS4亚型样本具有最长的生存期(OS)和无复发生存期(RFS),特征为20q11染色体扩增。
  • CRPS3 (21%):与CMS2对应,显示最低的免疫激活,TP53突变,具有最长的OS和RFS。
  • CRPS4 (12%):主要与CMS4对应,伴随基质、TGFβ和WNT通路激活,低氧和补体激活,预后较差,OS和RFS最短。
  • CRPS5 (11%):主要与CMS3对应,拷贝数变异(CNV)低,KRAS和FBXW7突变,WNT信号抑制,代谢增加,RFS最短。

CMS亚型(右侧):

  • CMS1: MSI Immune (15%):高频MSI和高突变率,BRAF突变,免疫浸润和激活。
  • CMS2: canonical (27%):拷贝数变异(CNV)高,WNT和MYC通路激活。
  • CMS3: metabolic (14%):混合MSI状态,拷贝数变异低,KRAS突变,代谢失调。
  • CMS4: mesenchymal (26%):拷贝数变异高,基质浸润,TGFβ激活和血管生成。
  • Undefined (18%):未定义亚型。

热图显示了每个 CRPS 亚型中的biomarker基因,其中红色表示特定基因高表达,蓝色表示低表达。此外,还展现了 CRPS 中 CMS 、 iCMS亚型等临床特征的分布情况。

(结合上图外还得另看补充表1)在这个称为 CRC 预后亚型 (CRPS) 的新分类中,97% 的 CMS1 肿瘤被归类为 CRPS1,CMS2 肿瘤分布在 CRPS2 (39%) 和 CRPS3 (59%) 之间,68% 的 CMS3 肿瘤被归类为 CRPS5,CMS4 肿瘤分布在 CRPS2 (38%) 和 CRPS4 (45%) 之间。重要的是,除 3 个肿瘤外,所有肿瘤均归类为 CRPS,而 192 个 (18%) 未被 CMS 分类,其中大多数被归类为 CRPS1 和 CRPS2。CRPS1 组包含 88% 的 HM 病例,而只有 56% 被归类为 CMS1。CRPS1 肿瘤最常发生在右结肠(79%)、年龄较大(中位年龄 76 岁)和女性(61%)患者中,并且体细胞 SNV 发生率最高,CNV 发生率最低。

CRPS分型的基因组特征

上图显示 96 个驱动基因1,063 个结直肠肿瘤 CRPS 亚型中的体细胞突变情况和拷贝数变异情况。其中CRPS2 和 CRPS3 亚型在解剖位置之间分布均匀,BRAF 突变频率较低。CRPS5 的 KRAS、PIK3CA 和 FBXW7 突变发生率最高,但与 CRPS2–CRPS4 相比,TP53 突变和 CNV 较少。

上图由 GISTIC 确定 CRPS 亚型显示的局部拷贝数区域。LOH,杂合性缺失;cn,拷贝数中性;AMP,扩增;HOMDEL,纯合缺失;HETLOSS,杂合缺失。

CRPS分型的转录组学特征

这张图展示了不同分子特征在不同CRPS亚型中的表现情况,包括基因突变、基因扩增、免疫细胞浸润、代谢通路活性和其他信号通路的激活状态。CRPS4 肿瘤通常是直肠肿瘤(47%),并表现出基质、TGFβ 和 WNT 通路激活,与 CMS4 一致;CRPS5 肿瘤通常来自右结肠 (46%),显示 WNT 信号抑制; CRPS2 中成纤维细胞、巨噬细胞和树突状细胞的比例介于 CRPS3 和 CRPS4 之间。

CRPS分型的生存分析情况

CRPS 亚型对 I-IV 期 OS(P = 0.01)、I-III 期 RFS(P = 0.025)和复发后生存率(P = 0.034)具有预后价值,其中 CRPS2 和 CRPS3 与最长的 OS 和 RFS 相关,CRPS4 与最短的 OS 和 RFS 相关,CRPS5 与较短的 RFS 相关,CRPS1 与复发后生存率最差。

分配给 CRPS2 的 CMS4 病例与分配给 CRPS4 的病例相比具有更长的 OS。

CRPS 对结直肠肿瘤分类的验证

为了加深对 nHM 肿瘤的了解,研究通过 CRPS、CMS 和 iCMS 亚型确定了预后特征。

预后不良的 nHM iCMS3 肿瘤主要为 CRPS1 和 CRPS4–CRPS5,在突变谱和临床结果方面显示出相似性。

(还需要另见补充表27、9)尽管与 iCMS2 肿瘤相比,它们的整体 CNV 负荷较低,但几种晚期 CNV 缺失与较短的生存期相关,而 BRAF 和 RNF43 突变是早期事件。大多数 nHM iCMS2 肿瘤为 CRPS2–CRPS3。在 nHM CMS4 肿瘤中,归类为 CRPS4 的肿瘤分为 iCMS2 和 iCMS3,而归类为 CRPS2 的肿瘤主要是 iCMS2。这可以解释这些肿瘤从更广泛的 CMS4 类别中分离出 CRPS2 和 CRPS4 亚型,后者的 CMS4 病例生存期较短。CRPS4 预后相对较差可能源于大多数肿瘤表现出 iCMS3 特征。

为了进行外部验证,研究开发了一个基于 ResNet50 CRPS 的分类器,并分析了来自 10 个队列的 2,832 例病例,准确率、精确率、召回率和 F1 得分均 >85%。

研究重现了 CRPS 的预后能力以及 CMS 与 CRPS 之间的对应关系,其中 CRPS2 具有最长的 OS,而 CRPS4 最短(所有 CRPS 的 P = 0.013)。

在验证队列中重现了 CRPS 亚型的通路特征。

总之,CRPS 在预后方面的预测优于 CMS,能够将非常高比例的肿瘤分配到亚型中,并且与单细胞特征结合时能够对 CRC 亚型提供更深入的了解。

8.肿瘤缺氧

在 27 种肿瘤类型中,CRC 的缺氧水平排名第3。为了阐明基因组和转录组改变与肿瘤氧合之间的联系,研究使用 Buffa 缺氧特征分析了转录组。

与未受影响的对照组织相比,肿瘤的缺氧评分持续升高;右结肠肿瘤最高,其次是左结肠和直肠肿瘤。此外,女性个体和高级别、HM 和 MSI 的肿瘤缺氧水平升高。

上图展现了缺氧评分(顶部)与突变特征(底部)的关联。右侧显示调整后的 FDR 值,虚线表示显著性阈值。左边与缺氧评分呈正相关的特征以粗体显示,其余特征与评分呈负相关。考虑到所有肿瘤,最强的关联是 SBS1、SBS5 和 ID1,在低缺氧肿瘤中普遍存在。 MMR 相关标记 SBS44、SBS26、SBS14、SBS-CRC1 和 DBS-CRC3 与高缺氧相关。相比之下,与 ROS 损伤相关的 SBS18 和与 colibactin 暴露相关的 ID18 呈负相关。与 DNA 复制过程中的滑移相关的两个 ID 突变标记都与缺氧相关,其中 ID1 呈负相关,而 ID2 呈相关。(还需另见补充表 28)

上图展现了根据 Buffa mRNA 丰度特征计算了所有肿瘤的缺氧评分(顶部),并将其与 96 个驱动基因中的突变相关联。在 nHM 肿瘤中,大多数驱动基因,特别是 SMAD4、SMAD2 和 FBXW7,与高缺氧相关。在 HM 肿瘤中,只有 RGMB、SMAD2、AREG 和 RFX5 突变与低缺氧相关。(还需另见补充表 28)

大多数 SV 类型与 nHM 肿瘤中的高缺氧相关,但只有缺失与 HM 肿瘤中的高缺氧相关。缺氧增加与 nHM 肿瘤中克隆突变数量较多有关,但与亚克隆突变无关。

(还需另见补充表 28)考虑所有肿瘤时,高 TMB 与缺氧有关。线粒体活性受损和 mtDNA-CN 异常是缺氧肿瘤的特征,并且 mtDNA-CN 与 HM 和 nHM 病例中的缺氧呈负相关。CRPS1 和 CRPS4 肿瘤缺氧最严重,而 CRPS3 和 CRPS5 缺氧最少。此外,未观察到直肠癌缺氧与磁共振成像确定的生存期或肿瘤大小之间的相关性。

总之,这些发现证实了先前在 nHM CRC 中的观察结果并提供了对 HM CRC 中缺氧的见解。

9.肿瘤微环境

肿瘤微环境的特征是基于转录组对基质和免疫细胞群的预测。

CRPS 分类的肿瘤微环境探究

CRPS 分类显示出免疫细胞浸润的差异性(a图是 CIBERSORT 做的,b图是 xCell 做的)。

CRPS1 富含 T 细胞、B 细胞、树突状细胞和巨噬细胞,CRPS2 富含造血干细胞、树突状细胞和巨噬细胞,而 CRPS3 肿瘤的免疫细胞浸润水平较低,但巨核细胞-红系祖细胞 (MEP) 和成骨样细胞的水平较高。在 CRPS4 中,成纤维细胞、软骨细胞、内皮细胞、造血干细胞和巨噬细胞富集,而上皮细胞、MEP 和 T 细胞较少。CRPS5 肿瘤以 CD4 中枢记忆 T 细胞和效应记忆 T 细胞为特征。

(需要另见补充表29和30)按 HM 和 MSI 状态分层时,与 HM 病例相比,nHM 肿瘤具有更多的成纤维细胞和造血干细胞以及粒细胞-单核细胞祖细胞,但间充质干细胞和免疫细胞浸润较少。在 nHM/MSS 病例中,M2 样巨噬细胞与较短的 OS 和 RFS 相关,而 T 细胞、树突状细胞和嗜酸性粒细胞与较长的 OS 和 RFS 相关。

MSI 分类的肿瘤微环境探究

大多数 MSI CRC 对免疫疗法有反应,但 45% 没有反应,这促使进行更细粒度的亚型分析。研究把转录组数据用无监督聚类将 MSI 结直肠癌样本分为两类。热图显示出每个 MSI 类中前 150 个biomarker基因表达情况。

a图是 CIBERSORT 做的,b图是 xCell 做的,展现两者分类中免疫细胞的浸润情况。其中第一类以淋巴细胞和基质细胞为特征,第二类以更丰富的 MEP 和 T 辅助 1 型细胞为特征。

上图a-b展现了两类 MSI 肿瘤的生存率、体细胞突变和拷贝数变异情况。两类 MSI 在 OS 或 RFS 上没有差异,但 M0 巨噬细胞和 B 细胞与 MSI 1 类中较长的 OS 和较短的 RFS 相关,而 M2 巨噬细胞、CD4+ T 细胞和红细胞与 MSI 2 类中较短的 OS 和 RFS 相关。MSI 1 类肿瘤更多有 ARID2 突变,而 2 类有更多的 BRAF 和 SMAD4 CNV、FOXP2 扩增和 7q11 增益。

此外,MSI 1 类肿瘤的缺氧程度也更高。免疫细胞组成和缺氧水平的这些差异促使人们未来对两类 MSI 的免疫疗法反应进行分析。

总结

这项研究进行了大规模的分析,整合了结直肠癌(CRC)的全基因组测序(WGS)和转录组数据,并结合了充足的临床随访信息,以深入探讨CRC的预后因素。

主要研究发现和贡献

1.扩展了CRC驱动基因的范围

新增了33个驱动基因,其中三分之二以前未被描述为癌症驱动基因,但与癌症相关的途径有关。

2.新突变特征的发现

识别出与缺陷DNA错配修复(MMR)和POLE突变相关的新突变特征。

3.时序分析揭示突变顺序

研究发现,大多数染色体丢失是早期事件,而扩增发生较晚;TP53突变早于PIK3CA突变和10q (PTEN)丢失。此外,还发现了早期和晚期的其他关键突变事件。

4.综合分析的重要发现

  • 有利的 CRPS2-CRPS3 型肿瘤富含 20 号染色体扩增,而这之前已被证明与良好的预后有关;

  • M1 巨噬细胞在预后良好的 CRPS1 肿瘤中富集,而 M2 巨噬细胞在预后不良的 CRPS4 肿瘤中富集;

  • 关键驱动基因表达水平与其突变状态相关;

  • 调控元件的预后突变与特定基因的表达改变有关;

  • 瘤缺氧与特定的突变特征有关;

  • MSI 肿瘤分为两类,具有不同的分子特征

与目前的分子分类器相比,预后 CRPS 特征提供了精细的 CRC 亚型,能够对绝大多数肿瘤进行分类。CRPS 的稳健性应在具有完整随访的更大规模队列中验证。

5.预后基因组因素的验证和新发现

研究总结已确定的预后基因组因素,证实了已知的预后相关基因(如APC、BRAF、RNF43和SMAD4)的作用,并发现了新的预后驱动基因(如TGFBR2)在HM CRC中的正向预后作用。值得注意的是,预后驱动基因属于 WNT、EGFR–KRAS–BRAF 或 TGFβ 通路。

未来研究方向

建议进一步研究MT-CYB、ID2、HS3ST1和DAPK1中的预后突变,并通过表观基因组、蛋白质组和代谢组的研究,探索不同预后特征之间的相互关系。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

组学之心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值