《Nature Communications》·揭秘ecDNA:癌症个性化治疗的潜在生物标志物

小罗碎碎念

文献日推:第7次

今天推荐的文章是2024年2月发表在《nature communications》的一篇文章,题为“Machine learning-based extrachromosomal DNA identification in large-scale cohorts reveals its clinical implications in cancer”,即**基于机器学习的大规模队列染色体外 DNA 鉴定揭示了其对癌症的临床意义**。

这里略微吐槽一下,这篇文章看的我欲仙欲死,好久没有看文献这么难受过了,不过这篇文章全部看完是有好处的,尤其是文中提到的工具,但是你能否掌握就看自己的本事了。


作者单位

  1. 华南肿瘤学国家重点实验室、广东省鼻咽癌诊治重点实验室、广东省肿瘤临床研究中心、中山大学肿瘤防治中心,广州 510060。
  2. 中国医学科学院消化道肿瘤精准诊疗研究室,广州 510060。

文章概述

本文**介绍了一项关于染色体外 DNA(ecDNA)在癌症治疗中的临床意义的研究。作者开发了一个名为 GCAP 的计算框架,用于从癌症全外显子组测序 (WES) 数据中识别和描述 ecDNA 扩增**。

他们分析了由**13000多名泛癌症患者组成的多个队列,发现ecDNA扩增与微卫星不稳定性(MSI)之间存在一致的互斥模式。他们还证明了 ecDNA 扩增作为风险因素的作用,并完善了结直肠癌的基因组亚型**。

此外,他们还纳入了四项以抗PD-1免疫疗法为重点的临床试验数据,结果表明,ecDNA扩增可作为指导胃肠道癌症检查点阻断免疫疗法的生物标志物。该研究提供了ecDNA扩增与免疫治疗干预有效性相关的证据,并强调了ecDNA扩增作为个性化癌症治疗的重要生物标志物的潜力。


要点总结

  1. 染色体外DNA(ecDNA)在癌症治疗中起着至关重要的作用。
  2. 作者开发了一种名为 GCAP 的计算框架,用于从癌症 WES 数据中识别和描述 ecDNA 扩增。
  3. 研究发现,ecDNA扩增与微卫星不稳定性(MSI)之间存在互斥性。
  4. 研究发现,ecDNA扩增是结直肠癌的一个风险因素,并完善了结直肠癌的基因组亚型。
  5. 研究表明,EcDNA扩增是指导胃肠癌检查点阻断免疫疗法的生物标志物。
  6. 该研究提供的证据表明,ecDNA扩增与免疫治疗干预的有效性有关。
  7. ecDNA扩增有可能成为个性化癌症治疗的重要生物标志物。

代码

分析代码(GitHub - ShixiangWang/gcap-wes

这份代码主要是由R语言编写完成的,并且最后的修改时间在两年以前。

GCAP软件包(https://github.com/ShixiangWang/gcap

这份代码仍然以R语言为主,但是截止小罗写稿前一周,作者还进行了维护。

Docker容器(https://github.com/ShixiangWang/gcap/pkgs/container/gcap

GCAPutils软件包(https://github.com/ShixiangWang/gcaputils


数据

人类癌基因列表

Oncogene数据库【70】(http://ongene.bioinfo-minzhao.org/)

用于基因预测建模的386个泛癌症样本的TCGA肿瘤-正常配对全外显子测序数据

  • 样本列表可在源数据文件中找到,从GDC数据门户使用gdc-client v1.6.1下载(dbGaP访问号phs000178.v9.p8)
  • https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000178.v9.p8

TCGA的等位基因特异性拷贝数轮廓

可以在https://github.com/VanLoo-lab/ascat/tree/master/ReleasedData/TCGA_SNP6_hg19找到。

PCAWG的等位基因特异性拷贝数轮廓和生存数据

可以在PCAWG Xena hub(https://pcawg.xenahubs.net)找到。

包括基因表达、突变、TCGA的生存数据等在内的其他类型的数据

可以在Pan-Cancer Atlas hub(https://pancanatlas.xenahubs.net)找到。

长港项目

  • 原始序列数据已存档于中国国家基因组数据中心/北京基因组研究所的基因组序列档案馆,存档号为HRA000873。
  • 长港项目的处理临床注释和结构化基因组数据集可以在赵等【54】和https://changkang.hapyun.com/找到。

用于ecDNA载体基因建模、GCAP和AmpliconArchitect结果的癌症细胞线、TCGA、PCAWG和长港项目、PDX/临床样本等处理数据已存档于Zenodo(https://doi.org/10.5281/zenodo.7272630),开放获取。

剩余的数据可以在补充信息或源数据文件中找到。源数据随论文提供。


一、引言

外染色体DNA(ecDNA)首次在1965年被观察到[1,2],然而,它**作为新兴的癌症标志物的关键作用仅最近随着技术的进步而显现[3]。ecDNA是平均大小为1 Mb的环状DNA元素,具有独特的性质[4,5],例如非孟德尔遗传的癌症特异性分子、高染色质可及性和聚集突变。已经进行了多项研究以描绘ecDNA的物理结构,以及ecDNA如何导致癌基因扩增、激活转录以及改变肿瘤基因组的速度和动态[6–12]。通过这些特征,ecDNA缓解了遗传限制,促进了肿瘤进化和肿瘤内异质性,使癌症更能适应肿瘤微环境**[13,14]。

作为一种重要的体细胞聚焦拷贝数扩增形式,ecDNA扩增被发现是驱动肿瘤生长、多药耐药性和不良生存结果的普遍事件,在广泛的癌症类型中[15–17]。这些发现表明ecDNA作为癌症诊断的分子标志物和癌症治疗药物靶点的潜力。尽管如此,依赖于可访问、支持的高通量癌症基因组数据的临床可行方法来识别ecDNA扩增仍然缺乏,ecDNA在常见异质性恶性肿瘤(例如结直肠癌(CRC))或先进治疗背景(例如检查点阻断免疫治疗)中的临床相关性尚未得到阐明。

ecDNA表征的方法对于ecDNA的基础和应用研究至关重要[18]。传统的细胞遗传学技术,如4ʹ,6-二氨基-2-苯基吲哚(DAPI)染色和荧光原位杂交(FISH),已被用来检测和定量ecDNA元素[6,19]。基于测序的方法,包括AmpliconArchitect[20]、AmpliconReconstructor[21]、Circle_Finder[22]和Circle-Map[23],从全基因组测序(WGS)数据推断ecDNA结构。相比之下,Circle-Seq[24]和CRISPR-CATCH[25]提供了针对ecDNA分析的增强分辨率。此外,ecTag方法通过使用引导RNA(gRNAs)和荧光标记器标记ecDNA特异性序列,使得在活细胞中可视化ecDNA成为可能[26]。

为了**从大规模临床癌症基因组测序数据中检测ecDNA扩增**,开发了里程碑式的计算工具包AmpliconArchitect[20],用于从WGS数据中虚拟重建ecDNA复杂的环状结构。此外,Circle-Seq技术[24]实现了一个测序文库富集方法,用于特异性富集环状DNA,允许直接测序潜在的环状DNA片段。随后使用Circle_Finder[22]和Circle-Map[23]等软件来识别和评分假设的ecDNA连接点。

尽管上述技术已被用于在多种癌症类型中理解ecDNA[5,17,27,28],但在成本和技术限制方面仍有改进空间。例如,Circle-Seq受到复杂实验程序、可检测ecDNA大小限制(大多数低于100Kb)和临床实践缺乏的限制。AmpliconArchitect仅适用于WGS数据,这限制了我们对从临床队列中获得的更广泛肿瘤样本进行研究的能力,这些样本通常通过全外显子测序(WES)进行测序。

与WGS相比,WES是一个更具成本效益的替代方案,涉及测序深度和基因组覆盖之间的权衡[29]。WES已在临床环境中开发和优化,特别是在前瞻性临床试验中,这导致了大量来自患者肿瘤样本的WES数据集的产生。考虑到临床肿瘤样本中可用的丰富的基于WES的数据以及WES提取生物学相关见解的能力,我们**假设利用WES数据识别ecDNA扩增的潜力将为理解ecDNA的临床意义带来关键进展**,特别是在癌症治疗的多样化背景下。

从WES原始读数重建ecDNA复杂的环状结构是一个难以解决的问题,因为支持ecDNA连接位点的嵌合读数通常位于外显子之外[20]。然而,高拷贝数扩增是ecDNA的一个独特特征[18]。以前的研究[30–35]和我们的初步分析(补充图1)已经表明,来自WES、WGS和SNP阵列的等位基因特异性基因拷贝数轮廓是可比的。因此,我们**专注于从WES中获取的基因层面特征,而不是从WGS中解码整个ecDNA扩增架构**[20,23]。

在本研究中,我们**开发了一个计算框架GCAP,它使用全外显子测序数据集来识别和表征临床癌症样本中的ecDNA扩增**。我们通过WES、WGS、Circle-Seq和SNP阵列数据从40个癌症细胞系和临床样本对GCAP进行了广泛验证。通过GCAP,我们分析了超过13,000个癌症样本的ecDNA光谱,并随后通过一系列关联分析揭示了其临床意义。总的来说,我们证明ecDNA可以改善结直肠癌的分子亚型方案,并在多种癌症中作为生存风险分层和免疫检查点抑制剂(ICI)治疗效果预测的有希望生物标志物。这些发现有助于理解ecDNA扩增在癌症发病机制中的作用,并为治疗干预的发展提供重要见解。


二、方法

2-1:细胞培养

人胃癌细胞系SNU16、HGC27、MKN45、NCI-N87、KATO III、MKN7、SNU216、MKN74,以及人食管癌细胞系KYSE-410、OE19和前列腺癌细胞系PC3,均购自美国典型培养物保藏中心(ATCC,位于马里兰州罗克维尔)。

除PC3细胞外,所有细胞均在含10%胎牛血清(FBS,Invitrogen)和1%青霉素-链霉素(Invitrogen)的RPMI 1640(GIBCO)培养基中培养。PC3细胞则在含10% FBS和1%青霉素-链霉素的DMEM(GIBCO)培养基中培养。所有细胞均在95%空气和5%二氧化碳的湿润大气中,于37°C条件下维持培养。细胞经检测未受到支原体污染。


2-2:患者衍生的异种移植(PDX)

本研究中使用的所有胃癌患者样本均是在知情同意后通过手术获得的。

收集的组织立即置于冰冷的DMEM培养基中,并添加链霉素和5%的青霉素。所有用于本研究的NOD/SCID/IL2rγnull(NSG)雌性小鼠(6周龄)。小鼠在受控温度(约20°C,40%湿度)和无病原体环境的条件下饲养,并设有12小时明暗周期。将小片组织(1-3 mm³)直接植入NSG小鼠的双侧皮下囊袋中。

在PDX的初始传代中,肿瘤体积增长到大约500 mm³,然后将其移植给其他小鼠(P2)。不同代数的PDX样本与组织保存溶液一起保存在液氮中。通过观察快速体重减轻、体重减轻超过体重的20%、弓背姿势、嗜睡、缺乏活动以及肿瘤快速增长等迹象来监测疼痛和痛苦。出现上述任何迹象的小鼠均通过颈椎脱位法安乐死。移植的肿瘤体积不得超过直径2.0厘米或体重的10%,这是由中山大学肿瘤防治中心临床研究和动物试验伦理委员会允许的。


2-3:荧光原位杂交(FISH)

对于中期DNA FISH,SNU16和PC3细胞用50 ng/ml的诺考达唑(Beyotime, S1765)孵育3-5小时以阻止它们进入有丝分裂。然后收集细胞并悬浮在0.075 M KCl(Sigma-Aldrich, P9541-500G)中,在37°C下孵育20分钟,并用Carnoy固定液(AIDISHENG, ADS004F0, 3:1甲醇/冰醋酸,v/v)在室温下固定10分钟。细胞在350 g下离心5分钟,并在-20°C下用Carnoy固定液再固定30分钟。

经过三次固定液洗涤后,将细胞滴在显微镜载玻片上。在相差显微镜下观察已风干的载玻片,避免载玻片上的细胞重叠,并在暗处过夜。然后将载玻片浸泡在预热的2X SSC中5分钟,并在37°C下用蛋白酶溶液孵育2分钟。用2X SSC缓冲液洗涤后,载玻片依次在70%、90%和100%乙醇中各2分钟脱水,并在室温下干燥。MYC(LBP, F.01006)或FGFR2(LBP, F.01197)的FISH探针添加到样本上,然后盖上盖玻片。样本在85°C下变性5分钟,并在ThermoBrite滑动处理系统(ThermoBrite-07J91)中于37°C下杂交过夜,然后用预热的0.3%NP-40/SSC在72°C下洗涤2分钟,用0.1%NP-40/2XSSC在室温下洗涤30秒。然后将载玻片依次在70%、90%和100%乙醇中各2分钟,并用DAPI染色。图像在Zeiss LSM 980共聚焦显微镜上使用63X油镜获取。

对于人结直肠癌(CRC)样本的石蜡包埋组织切片,载玻片用二甲苯脱蜡,并用乙醇系列脱水,然后用EDTA-Tris碱性缓冲液在95-99°C下孵育20分钟,并用蛋白酶溶液在37°C下处理8-10分钟。用2X SSC缓冲液洗涤后,载玻片用10%中性缓冲甲醛固定,并在70%、90%、100%乙醇中各2分钟脱水,并在室温下干燥。将MYC(LBP, F.01006)或ERBB2(LBP, F.01359)的FISH探针添加到样本上,并盖上盖玻片。样本在85°C下变性5分钟,并在ThermoBrite系统中于37°C下杂交过夜,然后用2X SSC和0.1%NP-40/2XSSC各5分钟洗涤。将载玻片依次在70%、90%和100%乙醇中各2分钟,并用DAPI染色10分钟。图像在Zeiss LSM 980共聚焦显微镜上使用63X油镜获取,或者通过Slide扫描仪(3DHISTECH)获取。在本研究中使用的患者组织样本均获得知情同意,并得到了中山大学肿瘤防治中心机构审查委员会的批准,位于中国广州。


2-4:DNA提取和全外显子/全基因组测序

从胃癌患者的血液、肿瘤、患者衍生的异种移植样本,结直肠癌患者的冷冻组织切片,以及癌症细胞系PC3、SNU16和SNU216中提取基因组DNA,使用DNeasy Blood & Tissue Kits(QIAGEN)或TIANamp Genomic DNA Kit(Tiangen,DP304)。

提取的DNA通过Qubit 3.0(Thermo Fisher Scientific, Inc.,Waltham, MA, USA)进行定量,遵循制造商的指示。DNA使用酶dsDNA Fragmentase(New England BioLabs, Inc.,Ipswich, MA, USA)进行剪切。断裂的基因组DNA进行末端修复、A加尾和连接,然后依次添加索引适配器,使用Agencourt AMPure XP珠(Beckman Coulter Inc.,Brea, CA, USA)进行大小选择。

DNA片段用于根据制造商的协议使用KAPA Library Preparation kit(Kapa Biosystems, Inc.,Wilmington, MA, USA)进行库构建。根据使用的DNA量,在预捕获的连接介导PCR(Pre-LM-PCR)Oligos(Kapa Biosystems, Inc.)中进行7到8个聚合酶链反应(PCR)循环,每个反应50 μL。全外显子测序(WES)使用Agilent SureSelect Human All Exon V6捕获试剂盒在Illumina NovaSeq 6000系统(150 bp配对末端)上进行,根据制造商的指示,平均深度为200X。全基因组测序(WGS)在Illumina NovaSeq 6000系统(150 bp配对末端)上进行,根据制造商的指示,平均深度为30X或10X。


2-5:环状DNA提取、测序和分析

使用Monarch® HMW DNA Extraction Kit(NEB,#T3050)从上述描述的人类癌症细胞系中收获环状DNA。线性染色体DNA通过添加ATP的质粒安全ATP依赖性DNase(Lucigen, E3101K)消化,并提供反应缓冲液。反应在37°C下过夜,然后通过在70°C下孵育30分钟使DNase失活。接下来,使用eccDNA纯化试剂盒(CAT#:220501-50)纯化环状DNA,然后根据制造商的说明使用REPLIg Midi Kit(QIAGEN, 150043)扩增。扩增的环状DNA使用Qubit 3.0荧光计(Thermo Fisher Scientific)进行测量,并剪切成平均片段大小为150-200 bp。使用NEBNext Ultra DNA Library Kit for Illumina根据制造商的协议制备库,并在Illumina NovaSeq 6000系统上根据制造商的指示进行2×150-bp配对末端读取的测序,平均数据量为30 G读数。

为了检测外染色体环状DNA区域,我们采用了Circle-Map Realign算法23,并应用了以下严格的过滤标准:CircleScore > 50,存在多于一个不一致的读数,至少四个分割读数,平均覆盖度超过4,覆盖连续性低于0.1(表明在整个环状DNA区域有广泛的读数覆盖,这是高质量识别的指示),并且区域长度超过10 kb。详细数据可在补充数据2中找到。值得注意的是,我们的方法与标准Circle-Seq程序在检测ecDNA方面有所不同,因为我们保留了线粒体DNA序列进行分析,作为每个癌症细胞系的内部阳性对照。


2-6:等位基因特异性拷贝数调用和特征提取

ASCAT v333(https://github.com/VanLoo-lab/ascat)用于为来自TCGA、长港项目以及抗PD1临床队列的癌**症患者的肿瘤-正常配对的全部**外显子测序数据生成等位基因特异性拷贝数轮廓。

更具体地说,基于ASCAT处理高通量测序数据的说明,

(1)使用ascat.prepareHTS函数从高通量测序数据中导出logR和BAF;

(2)应用GC含量校正和复制时序校正;

(3)在ascat.aspcf函数中设置惩罚值为70;

(4)在ascat.runASCAT函数中设置gamma值为1。

通过在等位基因特异性拷贝数轮廓上应用Sigminer【34】,为每个基因生成了七个样本级或基因级特征,包括total_cn(总拷贝数)、minor_cn(次要拷贝数)、肿瘤纯度【40,41】、肿瘤倍性、pLOH(LOH的基因组百分比35)、AScore(无丝分裂分数38,39)和cna_burden(拷贝数改变负担37)。同时,通过在3,212名癌症患者的WGS上使用AmpliconArchitect检测到的四种扩增子类型(环状(外染色体DNA)、BFB(断裂-融合-桥接)、HR(重排)、线性)以及相应的扩增子区域,为每个基因生成任何扩增子类型的频率,得到四个特征,分别命名为freq_Circular、freq_BFB、freq_HR、freq_Linear。然后将四个基因级先验与基因标识符连接,形成七个特征,即total_cn、minor_cn、tumor purity、tumor ploidy、pLOH、AScore和cna_burden,得到11个特征作为基因级预测建模的基本特征集。


2-7:使用AmpliconArchitect识别ecDNA、仅肿瘤拷贝数调用和特征提取

对于收集的40种癌症细胞系的肿瘤仅全基因组测序FASTQ数据(补充数据1),直接应用了**生物信息学最佳实践分析管道**【69】,以使用AmpliconArchitect方法(https://nf-co.re/circdna, v1.0.2)识别ecDNA,并输出了识别结果。

AmpliconArchitect使用CNVkit32(https://github.com/etal/cnvkit, RRID:SCR_021917)从拷贝数轮廓生成种子区域,因此也收集了CNVkit的结果,以便进一步与细胞系特异性性别和固定的肿瘤纯度1进行阈值处理,以**获得绝对拷贝数轮廓**。

之后,导出了上述部分中描述的11个特征。注意,NA值被设置为minor_cn和pLOH,因为它们可以从总拷贝数轮廓中获得或计算。类似地,自行生成的肿瘤仅全外显子测序数据,以及癌症细胞系PC3和SNU16的数据,通过CNVkit批处理命令进行分析,以获取拷贝数分割结果,然后使用细胞系特异性性别和固定的肿瘤纯度1重新调用,以获得绝对拷贝数轮廓。随后,导出了11个基因级特征。


2-8:ecDNA与癌基因的关联分析

为了探索与外染色体DNA扩增相关的癌基因,首先从Oncogene数据库70(http://ongene.b**ioinfo-**http://minzhao.org/)中导出癌基因列表,然后构建了多变量线性回归模型,以发现与ecDNA相关的癌基因。

简而言之,对于每个基因,构建了一个多变量线性回归模型,公式如下:

TPM = a × CN + b × Circular + c × CancerType + d × TumorPurity + e

该公式用于检查一个基因是否在外染色体DNA(“circular”)上扩增,是否可以显著影响其在基因拷贝数、肿瘤癌症类型和肿瘤纯度等混杂因素调整下的自身转录水平。对所有基因的结果应用了多重假设检验的FDR方法。如果一个基因的FDR值小于0.05,则确定该基因为与ecDNA相关的癌基因。


2-9:突变签名分析

使用R包Sigminer v2.2.034(https://github.com/ShixiangWang/sigminer)结合参考拟合方法识别突变签名。

使用COSMIC SBS突变签名数据库v371(https://cancer.sanger.ac.uk/signatures/sbs/)作为参考重新拟合SBS签名的贡献。使用先前报道的等位基因特异性拷贝数签名35作为参考重新拟合拷贝数签名的贡献。

APOBEC相关突变是通过将APOBEC突变签名SBS2和SBS13的绝对活性相加来估计的。高突变签名被定义为基于COSMIC数据库注释信息中的以下任何签名之一:SBS6、SBS9、SBS10、SBS14、SBS15、SBS20、SBS21、SBS26和SBS44。


2-10:统计分析

两个或多个组之间的连续数据使用Mann–Whitney检验进行比较。两个或多个组之间的分类数据使用Fisher检验或Chi-squared检验进行比较。相关性分析使用Pearson方法进行。

Kaplan-Meier生存曲线通过log-rank检验生成并比较。线性模型通过F检验的ANOVA分析进行比较。多变量生存分析使用Cox回归模型进行。

多变量关联和响应分析使用逻辑回归模型进行。所有报告的P值都是双尾的,除非另有说明,对于所有分析,P ≤ 0.05被认为是统计学上显著的。多重测试的P值通过Benjamini–Hochberg FDR方法进行校正。所有统计分析均使用R v4.0.2完成。


  • 20
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: "Nature Communications"是一份由《自然》杂志集团出版发行的科学研究期刊,该期刊涵盖了物理、化学、生物学、地球科学和环境科学等各个学科领域。它的目标是通过开放性的出版平台促进科学研究的分享和交流,以推动全球科学研究的进展。 ### 回答2: ### 回答3: Nature Communications 是自然期刊集团旗下的一本高质量、高影响力的学术期刊。在其官网上的介绍中,Nature Communications 被描述为一本致力于为全球学术界提供高质量,跨学科的研究成果发布平台的期刊。不仅如此,Nature Communications 还积极倡导科学合作,为学术界搭建构建一个可靠的,可持续发展的合作和交流平台。 Nature Communications 的优势在于其开放获取、同行评审的学术发表过程。这一过程保证了文章的质量和可靠性,并且使得这些文章能够被全球范围内的读者免费阅读。期刊涵盖了多个学科领域,包括物理学、化学、生物学、地球与环境科学等等。而每一篇文章都必须从跨领域的角度出发,提供一个新的综合性视角,从而提升文献的学术价值和研究意义。 Nature Communications 拥有严格的同行评议制度,已经成为很多科学家发表论文的理想平台。而随着开放获取的流行,Nature Communications 的影响力也在不断增长。根据最新统计数据,Nature Communications 的影响因子已经超过 12 分,文章被引频次逐年增长,成为学者们分享研究成果的首选学术期刊之一。 总之,Nature Communications 是备受欢迎的高质量学术期刊,在世界范围内影响力不断扩大。作为学者们交流学术成果的平台,它不仅促进了学术合作和创新,也进一步推动了学术界的发展和进步。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值