易基因:cfDNA甲基化组多模式分析早期检测食管鳞状细胞癌和癌前病变|Nature子刊

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

食管癌(EC)是最常见的胃肠道恶性肿瘤之一,食管鳞状细胞癌(ESCC)是EC的主要组织学亚型,约占新EC病例的88%,大多数发生在东亚和中亚。与晚期ESCC的预后极差相比,早期ESCC(如黏膜内ESCC)和前体病变(如上皮内瘤变,IEN)可以通过内镜下整块切除术实现近100%的五年疾病特异性生存率,从而无需系统性治疗。因此检测早期食管鳞状细胞癌(ESCC)和癌前病变对于提高生存率至关重要。

液体活检能够检测血浆中游离细胞DNA(cfDNA)内的循环肿瘤DNA(ctDNA),为非侵入性早期癌症检测提供了希望。然而关于液体活检在ESCC诊断中应用的研究还很少。在最近对循环游离细胞基因组图谱(CCGA)中cfDNA的多组学分析中,全基因组cfDNA甲基化成为癌症检测最有希望的信号,优于片段化标记和基因突变(如拷贝数变异,CNV)。然而,基于甲基化的ctDNA检测方法仍存在一些挑战。

中国医学科学院北京协和医学院刘芝华团队、陈洪岩团队和温州医科大学眼科医院瓯江实验室苏建忠团队合作对来自230名非转移性ESCC或癌前病变患者和230名来自多个中心的匹配健康对照(HC)的共460个cfDNA样本进行了全基因组重亚硫酸盐测序(WGBS)。并开发了一种扩展多模式分析(expanded multimodal analysis,EMMA)综合方法,可以同时鉴定cfDNA WGBS数据中的cfDNA甲基化、拷贝数变异(CNV)和片段化标记。cfDNA甲基化标记是最早期和最敏感,可在70%的ESCC和50%的癌前病变中检测到,并与分子亚型和肿瘤微环境相关。CNV和片段化标记表现出高特异性,但与晚期疾病有关。EMMA方法显著提高了检出率,将AUC(area under the curve)从0.90增加到0.99,并在验证队列中检测到87%的ESCC和62%的癌前病变,特异性>95%。研究通过多模式分析方法分析了cfDNA-WGBS数据,揭示了cfDNA甲基化组的多模式分析对于早期检测和监测ESCC分子特征的潜力。相关研究成果于2024年5月2日以“Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions”为题发表在《Nature Communications》(IF 16.6/Q1)期刊上。

cfDNA全基因组重亚硫酸盐测序中的EMMA framework

为加强ESCC的早期检测,研究人员基于“组织-cfDNA-组织”策略开发了EMMA framework方法(图1a)。从配对的WGBS和原发性肿瘤的全基因组测序(WGS)数据中鉴定出ESCC的DMR和CNV,并从之前的队列ESCC基因组和表观基因组图谱(ECGEA)中匹配了155例ESCC病例的邻近癌旁组织。随后分析了cfDNA WGBS数据中ESCC的DMR和CNV。基于肿瘤细胞的片段比正常细胞的片段更短,研究人员进一步计算了短cfDNA片段大小的比例作为cfDNA-WGBS数据中的片段大小比(FSR)。接下来使用包含150名ESCC患者和150名匹配的HC的数据集,采用随机森林的机器学习方法,利用DMR、DMR与CNV、所有三个功能(DMR、CNV和FSR),在外部ESCC队列和癌前队列中独立评估每种诊断模型的性能。此外将最佳DMR与成对ESCC组织样品中基于多组学的整合分子亚型、肿瘤微环境(TME)、存活率和转录组学图谱进行关联分析。

研究设计了不同的队列,包括来自中国医学科学院癌症医院和中国北京协和医学院的150名未经治疗的ESCC或食管高度上皮内瘤变患者(HGIEN,即0期ESCC)(CHCAMS,发现/训练队列),来自上海胸科医院的30名未经治疗的ESCC患者(外部验证队列),来自CHCAMS的50名食管IEN患者(癌前验证队列)和230名HC,每位患者的年龄和性别在各自的队列中相匹配(图1b)。在进行任何医疗干预之前,研究人员从每位受试者(n=460)中位数收集2mL血浆。ESCC患者和对照组cfDNA浓度一致。WGBS用于评估每位受试者的cfDNA甲基化组,460个cfDNA样品占参考基因组的约89%覆盖率,平均深度为9.51X。

图1:研究设计和患者入组。

  1. 使用机器学习开发了EMMA多模式分析方法,以加强血浆样品cfDNA中ctDNA的检测。该方法通过全面分析cfDNA全基因组亚硫酸盐测序(cfWGBS)数据中癌症来源的差异甲基化区域(DMR)、拷贝数变异(CNV)和片段化标记。最初从155例食管鳞状细胞癌(ESCC)患者的原发性肿瘤和匹配的相邻癌旁组织的配对WGBS数据和WGS数据中鉴定出癌症来源的DMR和CNV。随后在cfWGBS数据中分析了ESCC来源的DMR和CNV,并进一步利用短cfDNA片段大小比例来训练发现队列中的诊断模型。在外部ESCC队列和癌前队列中独立评估了每种诊断模型的性能。为了揭示这些最佳DMR的生物学意义,研究人员将它们与成对ESCC组织样品中基于多组学的分子亚型和转录组学谱相关联。
  2. 该发现队列包括150名ESCC或高级别上皮内瘤变患者和150名匹配的健康对照,以使用不同的cfDNA特征构建诊断模型。在外部ESCC队列和癌前队列中独立评估每个诊断模型的性能。

ESCC:食管鳞状细胞癌,IEN:上皮内瘤变,WGS:全基因组测序,WGBS:全基因组亚硫酸盐测序,cfWGBS:cfDNA WGBS,RNAseq:RNA测序,HC:健康对照,CNV:拷贝数变异,DMR:差异甲基化区域,IM:免疫调节,CCA:细胞周期通路激活,IS:免疫抑制,NRFA:NRF2致癌激活。

cfDNA甲基化标记物的鉴定和性能

图2:食管鳞状细胞癌的游离DNA甲基化标志物及其性能检测。

  1. 在食管鳞状细胞癌(ESCC)组织中发现的差异甲基化区域(DMRs)中,通过调整后的p值<0.05(双侧Wilcoxon检验)recall了650个DMRs,这些DMRs在发现队列中的ESCC平均值(n=150)比健康对照组(n=150)更为显著。图中展示了前十个DMRs的恶性比例和p值。数据以最大值和最小值的中值表示。
  2. ESCC-cfMeth评分的诊断性能在发现队列(十倍交叉验证,每种颜色的曲线表示一次交叉验证)、外部验证队列和癌前验证队列中进行了评估。黑色曲线表示受试者ROC曲线,蓝色区域表示95%置信区间(CI)。
  3. 使用最佳50个标记的cfDNA恶性比例构建最终预测模型(ESCC-cfMeth评分)。与发现队列和验证队列中的健康对照(HCs)相比,ESCC和上皮内瘤变(IEN)患者的ESCC-cfMeth评分显著更高(双侧Mann-Whitney U检验,p<0.01)。数据以最大值和最小值的中值表示。
  4. 与健康对照组相比,不同阶段的ESCC(左侧;n=30、9、6和 15,分别为各阶段的样本数)和IENs(右侧;n=50、12和 38,分别为各阶段的样本数)的ESCC-cfMeth评分显著提高。数据以最大值和最小值的中值表示。
  5. 在ESCC组织和配对的相邻癌旁组织(n=155)之间的基因表达比较中,发现50个最佳DMRs中的功能基因表达存在差异(使用双侧Wilcoxon检验或t检验,ZNF132的p值<2.2×10^-16,LINC00680、FLT1和ID1的p值分别为1.1×10^-8、2.7×10^-14和0.078)。

cfDNA中鉴定CNV用于ESCC检测

图3:cfDNA全基因组亚硫酸盐测序数据中的拷贝数变异事件的recalling和分析

  1. 基于全基因组重亚硫酸盐测序(WGBS)方法,从组织和cfDNA中recalling WGBS数据中的重复拷贝数变异(CNV)。
  2. 以ECGEA队列中的002号患者为例,在全基因组测序数据中鉴定出chr.3、chr. 5的扩增和chr. 3、4、9、10、11、13、16、18、21的缺失,并在成对的WGBS数据中recall。
  3. 150例食管鳞状细胞癌(ESCC)患者中,153个区域的CNV事件发生率显著高于150例健康对照组(HCs)。扩增(红色)和缺失(蓝色)用ESCC与HCs差异的相应调整p值(错误发现率,FDR)显示(双侧t检验;ns,灰色;FDR<0.05,黄色;FDR<0.01,橙色;FDR<0.001,深红色)。
  4. ESCC和上皮内瘤变(IEN)患者的CNV阳性率显著高于发现队列和验证队列中的HCs,并且与分期和分级呈正相关。

ESCC:食管鳞状细胞癌,IEN:上皮内瘤变,LGIEN:低级别IEN,HGIEN:高级别IEN,HC:健康对照,WGS:全基因组测序,WGBS:全基因组重亚硫酸盐测序,GMM:高斯混合模型,HMM:隐马尔可夫模型,CNV:拷贝数变异,AMPL:扩增,DELE:缺失,ns:无显著性,G级。

cfDNA-WGBS数据中片段大小的检测

图4:分析全基因组重亚硫酸盐测序数据中的cfDNA片段大小。

  1. 在发现队列中分析cfDNA片段大小。食管鳞状细胞癌(ESCC)患者和健康对照组的cfDNA peaks均为166 bp。但在ESCC中鉴定出更多的短片段(90–150bp)。
  2. 以全基因组重亚硫酸盐测序数据中的片段大小比(FSR)计算cfDNA的短片段比例。
  3. 人类基因组分为5Mb bins,共产生1082(541个bins×2)个FSR。
  4. 在发现队列中,ESCC患者和HCs之间所有bins的平均FSR均无显著差异。但83个bins中ESCC患者的FSR显著高于发现队列中HCs。发现队列和外部验证队列中的ESCC患者中83个选定BIN的平均FSR显著高于癌前验证队列中的上皮内瘤变患者(双侧Mann–Whitney U检验,p < 0.05)。数据以具有最大值和最小值的中值表示。

联合EMMA模型准确检测ESCC和癌前病变

图5:三种cfDNA特征的互补性和组合模型的性能。

  1. 人类基因组中cfDNA甲基化标记、拷贝数变异和片段化标记分布。
  2. 在发现队列的食管鳞状细胞癌(ESCC)患者中发现了这三个标记之间的互补性。每个条形图表示ESCC患者中每个标记的状态。
  3. 在外部验证队列和癌前验证队列中评估ESCC-cfMeth评分、DMR加CNV模型、和EMMA模型的诊断性能。
  4. ESCC-cfMeth评分、DMR加CNV模型、和EMMA模型对上皮内瘤变(IEN)I、II和III期ESCC的检出率。
  5. 在外部验证队列中,三个标记的互补性提高了组合模型的性能。
  6. 根据不同的实验间隔,从5年到连续测试(理想化),评估EMMA模型和ESCC-cfMeth模型的潜在生存效益。
  7. 不同cfDNA标记和组合模型的检出率以及不同阶段的5年生存率示意图。

cfDNA甲基化标记的生物学意义

图6:DNA甲基化标记在食管鳞状细胞癌cfDNA中的生物学意义。

  1. 根据ESCC-cfMeth评分中50个最佳DNA甲基化标记的平均甲基化水平,将ECGEA队列中的155例食管鳞状细胞癌(ESCC)患者分为三组。
  2. ESCC分子亚型在甲基化显著组(methylation-dominate)(n=69)、甲基化中度组(methylation-moderate)(n=54)和甲基化缺失组(methylation-poor)(n=32)中的比例。
  3. 通过双侧t检验对甲基化显著组(n=69)和甲基化中度组/甲基化缺失组(n=86)比较分析肿瘤微环境中的细胞组分。(p=6.6×10-3、0.04、0.01、0.04和0.04分别用于上皮细胞、CD4+T细胞、CD8+T细胞、B细胞和树突状细胞)。
  4. 这些通路在甲基化显著组和甲基化缺失组中富集。

研究小结:

本研究分析了循环游离DNA(cfDNA)中鉴定出的最佳甲基化标记的生物学意义。研究首先从大量配对的食管鳞状细胞癌(ESCC)组织样本中获得的全基因组亚硫酸盐测序(WGBS)数据中鉴定了差异甲基化区域(DMRs),并通过与多种细胞类型的比较验证其特异性。在这些DMRs中发现了与ESCC相关且表达显著不同的已知功能基因。随后根据最佳DMRs的甲基化水平将ESCC患者分为三组。甲基化显著组表现出更高的CCA亚型和上皮细胞组分患病率,这也与更好的存活率相关。相比之下,肿瘤微环境(TME)的分析和差异表达显示,免疫细胞的升高和免疫过程的增强可能会减少与ESCC相关甲基化标记信号。甲基化中等组和甲基化缺失组属于IM亚型的ESCC患者比例较高。这一亚型对免疫疗法的灵敏度高于其他ESCC亚型,表明cfDNA检测在预测和监测免疫疗法反应方面的潜力。总体而言,本研究为cfDNA甲基化标记的生物学和临床意义提供了全面的见解,并提供了一种用于动态监测ESCC分子特征的非侵入性工具。

同时本研究有几个局限性:

a)尽管分析了1000多个全基因组数据集,但本研究验证队列相对较小。

b)这些多模式标记的潜在功能仍然未知,尤其是在癌前病变中。

c)本研究是以成本效益高且节省样本的方式从WGBS数据中获得了拷贝数变异(CNVs)和片段化标记,但在WGBS中的亚硫酸盐转化过程中,一些cfDNA片段可能会受损,与直接从cfDNA WGS数据相比,可能会削弱CNVs和片段化标记的信号。

d)由于在WGBS数据中突变calling的不可靠性,本多模式模型中未纳入突变。使用其他方法准确鉴定TP53等基因突变可能会进一步提高ESCC的检出率。

e)ESCC-cfDNA和EMMA模型的生存效益和预后意义需要在大规模真实世界队列中进一步验证。

总之,本研究通过多模式方法对液体活检中的cfDNA甲基化、CNV和片段化标记进行了全面分析,以实现ESCC的超早期检测。通过多模式方法分析cfDNA WGBS数据鉴定了几种分期特异性标记及其互补性。研究不仅显著提高了ESCC的非侵入性检测能力,而且还具有动态分子监测和治疗指导的潜力。

关于易基因微量cfDNA甲基化测序(cfDNA-BS)技术

cfDNA片段化严重,片段大小常在150bp左右,现有甲基化检测技术包括cfMeDIP和微量WGBS等。无法做到碱基分辨、具有抗体特异性和非特异性捕获、覆盖深度低、检测成本高等特点。常规RRBS富集约70-350bp范围酶切片段,如对于CG含量高的片段将被切割的更碎而无法检测,保留下来的片段反而是CG含量低,无甲基化信息的基因片段。

易基因研发cfDNA-RBS技术,特异性捕获CCGG位点两端的DNA,通过亚硫酸盐测序,实现高深度,单碱基分辨检测CG位点甲基化信息。DNA起始量仅需1ng,是目前肿瘤甲基化标志物检测研究的优选技术。

技术优势:

  • 超低起始量:100-500ul血浆或1ng cfDNA;
  • 测序覆盖度高:20G测序数据,可达10M的CG位点覆盖,涵盖CpG岛、启动子、增强子、CTCF结合位点等多种核心调控区域
  • 单碱基分辨率:在其覆盖范围内可精确分析每一个C碱基的甲基化状态;
  • 性价比高:成本相对于现有技术大幅降低。

技术指标

应用场景:

  • 癌前病变的癌变预警标志物检测
  • 肿瘤早期筛查标志物检测
  • 肿瘤预后标志物检测
  • 药物疗效预测标志物检测

易基因提供全面的表观基因组学(DNA甲基化、DNA羟甲基化)和表观转录组学(m6A、m5C、m1A、m7G)、染色质结构与功能组学技术方案(ChIP-seq、ATAC-seq),详询易基因:0755-28317900.

参考文献:

Liu J, Dai L, Wang Q, Li C, Liu Z, Gong T, Xu H, Jia Z, Sun W, Wang X, Lu M, Shang T, Zhao N, Cai J, Li Z, Chen H, Su J, Liu Z. Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions. Nat Commun. 2024 May 2;15(1):3700. pii: 10.1038/s41467-024-47886-1. doi: 10.1038/s41467-024-47886-1. PubMed PMID: 38697989.

相关阅读:

揭秘:cfDNA甲基化在器官和组织损伤检测中的强大力量

深度综述 | cfDNA甲基化诊断和监测肿瘤的研究进展与展望:胰腺癌

干货:cfDNA甲基化测序实验怎么做,看完你就知道了

3文一览:基于cfDNA甲基化的液体活检在胰腺疾病中的研究进展

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值