Topic 7. 克隆进化之 Cardelino

单细胞克隆进化也是目前的热点系列,接下来我们将介绍几款分析单细胞克隆进化的软件。前一期介绍的Canopy通过SNV 和 CNV 做细胞系的克隆进化,而 Cardelino 基于Canopy 的结果对单细胞测序中检测到突变位点进行分析。

图片

单细胞DNA测序能够从体细胞变异的频率和共现模式重建体细胞组织的克隆亚结构。然而,研究无性系间表型变异的方法尚未建立。Cardelino 使用 scRNA-seq 来推断克隆树构型和单个细胞的克隆起源的计算方法。Cardelino 灵活地集成了基于大量WES-seq数据推断的不完全克隆树的信息,以及在 scRNA-seq 数据中表达的稀疏变异等位基因。我们将 Cardelino 应用于一个已发表的癌症数据集,以及从32个人类真皮成纤维细胞系中新生成的匹配的 scRNAseq 和 WES-eq 数据,识别出来自不同体细胞克隆的细胞之间的数百个差异表达基因。这些基因经常丰富细胞周期和增殖途径,表明细胞分裂基因在健康皮肤的体细胞进化中的作用。

  • 关于安装问题

该软件包基于R语言开发出来,所以安装较为简单,如下:

install.packages('devtools')
install_github("single-cell-genetics/cardelino", build_vignettes = FALSE)
library(cardelino)
browseVignettes("cardelino")
  • 关于输入数据

本文档介绍和概述了使用 Cardelino 包使用给定的克隆结构推断细胞的克隆身份。Cardelino 可以使用从单细胞 RNA-seq 序列中提取的变异信息,以概率的方式将单细胞转录组分配给单个克隆。简单地说,Cardelino 是基于 Bayesian mixture model with a beta-binomial error model来解释测序错误,以及单倍型和变异检测中相关偏差之间等位基因不平衡的基因特异性模型。贝叶斯推理允许模型考虑模型参数和细胞分配的不确定性。我们假设克隆被体细胞突变标记,并且这些突变是已知的(例如,从外显子组测序或等效)。给定一组已知的突变,这些位点可以在scRNA-seq读取中被检测出来,以获得每个细胞中每个突变存在或不存在的证据。作为输入,该模型要求每个突变位点上支持替代(突变)等位基因的 Reads 计数,即重叠突变位点的总 Reads 数(覆盖率)。通常,体细胞突变在 scRNA-seq 数据中的覆盖范围非常稀疏(给定细胞中的大多数突变位点没有Reads 覆盖),但 Cardelino 模型解释了这种稀疏性,并在所有可用突变位点上聚集信息,以推断克隆本质。

单细胞数据与组织有些不同之处,所以这里需要注意一下细节上的比较,输入数据为vcf文件,多细胞或者单个文库的数据合并之后的vcf,每个突变位点在每个样本中都有相应的信息,如下:

##fileformat=VCFv4.2
##source=cellSNP_v1.2.0
##FILTER=<ID=PASS,Description="All filters passed">
##FILTER=<ID=.,Description="Filter info not available">
##INFO=<ID=DP,Number=1,Type=Integer,Description="total counts for ALT and REF">
##INFO=<ID=AD,Number=1,Type=Integer,Description="total counts for ALT">
##INFO=<ID=OTH,Number=1,Type=Integer,Description="total counts for other bases from REF and ALT">
##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
##FORMAT=<ID=PL,Number=G,Type=Integer,Description="List of Phred-scaled genotype likelihoods">
##FORMAT=<ID=DP,Number=1,Type=Integer,Description="total counts for ALT and REF">
##FORMAT=<ID=AD,Number=1,Type=Integer,Description="total counts for ALT">
##FORMAT=<ID=OTH,Number=1,Type=Integer,Description="total counts for other bases from REF and ALT">
##FORMAT=<ID=ALL,Number=5,Type=Integer,Description="total counts for all bases in order of A,C,G,T,N">
##contig=<ID=1>
##contig=<ID=2>
##contig=<ID=3>
##contig=<ID=4>
##contig=<ID=5>
##contig=<ID=6>
##contig=<ID=7>
##contig=<ID=8>
##contig=<ID=9>
##contig=<ID=10>
##contig=<ID=11>
##contig=<ID=12>
##contig=<ID=13>
##contig=<ID=14>
##contig=<ID=15>
##contig=<ID=16>
##contig=<ID=17>
##contig=<ID=18>
##contig=<ID=19>
##contig=<ID=20>
##contig=<ID=21>
##contig=<ID=22>
##contig=<ID=X>
##contig=<ID=Y>
#CHROM  POS  ID  REF  ALT  QUAL  FILTER  INFO  FORMAT  ERR2806034  ERR2806035  ERR2806036  ERR2806037  ERR2806038  ERR2806039  ERR2806040  ERR2806041  ERR2806043  ERR2806044  ERR2806045  ERR2806046  ERR2806047  ERR2806048  ERR2806049  ERR2806050  ERR2806051  ERR2806052  ERR2806053  ERR2806054  ERR2806055  ERR2806056  ERR2806057  ERR2806058  ERR2806059  ERR2806060  ERR2806061  ERR2806063  ERR2806064  ERR2806065  ERR2806066  ERR2806067  ERR2806068  ERR2806069  ERR2806070  ERR2806071  ERR2806072  ERR2806073  ERR2806074  ERR2806075  ERR2806076  ERR2806077  ERR2806078  ERR2806079  ERR2806080  ERR2806081  ERR2806082  ERR2806084  ERR2806085  ERR2806086  ERR2806087  ERR2806088  ERR2806089  ERR2806090  ERR2806091  ERR2806093  ERR2806094  ERR2806095  ERR2806096  ERR2806097  ERR2806098  ERR2806100  ERR2806101  ERR2806102  ERR2806103  ERR2806104  ERR2806105  ERR2806106  ERR2806107  ERR2806108  ERR2806109  ERR2806110  ERR2806111  ERR2806112  ERR2806113  ERR2806114  ERR2806115
chr1  19433131  .  G  A  .  PASS  AD=0;DP=47;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:3:0:0,9,125:0,0,3,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:4:0:0,12,167:0,0,4,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:27:0:0,81,1077:0,0,27,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:13:0:0,39,516:0,0,13,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  44437461  .  A  T  .  PASS  AD=0;DP=19;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:1,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,38:1,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:3:0:0,9,115:3,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,74:2,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:2,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:2,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:3:0:0,9,121:3,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:1,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,80:2,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:1,0,0,0,0  0/0:0:1:0:0,3,42:1,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  77558151  .  G  A  .  PASS  AD=4;DP=30;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,38:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,0,2,0,0  .:.:.:.:.:.  0/0:0:5:0:0,15,209:0,0,5,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  1/1:1:1:0:42,3,0:1,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  1/1:3:3:0:115,9,0:3,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:6:0:0,18,251:0,0,6,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:6:0:0,18,228:0,0,6,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  116944270  .  C  T  .  PASS  AD=31;DP=181;OTH=0  GT:AD:DP:OTH:PL:ALL  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  0/0:0:3:0:0,9,125:0,3,0,0,0  0/0:0:2:0:0,6,74:0,2,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:1:0:0,3,38:0,1,0,0,0  0/0:0:5:0:0,15,176:0,5,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  1/1:2:2:0:84,6,0:0,0,0,2,0  0/0:0:2:0:0,6,84:0,2,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  0/0:0:3:0:0,9,121:0,3,0,0,0  .:.:.:.:.:.  0/0:0:1:0:0,3,38:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,61:0,2,0,0,0  0/0:0:6:0:0,18,251:0,6,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,80:0,2,0,0,0  0/0:0:2:0:0,6,80:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,32:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  0/0:0:13:0:0,39,533:0,13,0,0,0  0/0:0:7:0:0,21,292:0,7,0,0,0  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  0/0:0:5:0:0,15,201:0,5,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:27:0:1,82,1033:0,27,0,0,0  1/1:27:27:0:1124,81,0:0,0,0,27,0  0/0:0:3:0:0,9,121:0,3,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:4:0:0,12,167:0,4,0,0,0  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  0/0:0:4:0:0,12,157:0,4,0,0,0  0/0:0:2:0:0,6,84:0,2,0,0,0  0/0:0:9:0:0,27,376:0,9,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,80:0,2,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  1/0:2:3:0:84,9,42:0,1,0,2,0  0/0:0:17:0:0,51,687:0,17,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  0/0:0:5:0:0,15,205:0,5,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:1:0:0,3,42:0,1,0,0,0
chr1  155449828  .  G  A  .  PASS  AD=6;DP=30;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  1/1:6:6:0:251,18,0:6,0,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:15:0:0,45,627:0,0,15,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:8:0:0,24,324:0,0,8,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  196711163  .  G  A  .  PASS  AD=0;DP=6;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:6:0:0,18,251:0,0,6,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  196711164  .  G  A  .  PASS  AD=0;DP=6;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:6:0:0,18,251:0,0,6,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  197070908  .  G  A  .  PASS  AD=0;DP=110;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:6:0:0,18,251:0,0,6,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,0,1,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:5:0:0,15,209:0,0,5,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:5:0:0,15,209:0,0,5,0,0  0/0:0:13:0:0,39,535:0,0,13,0,0  .:.:.:.:.:.  0/0:0:5:0:0,15,201:0,0,5,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:3:0:0,9,117:0,0,3,0,0  0/0:0:2:0:0,6,84:0,0,2,0,0  .:.:.:.:.:.  0/0:0:19:0:0,57,786:0,0,19,0,0  .:.:.:.:.:.  0/0:0:4:0:0,12,167:0,0,4,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,0,2,0,0  .:.:.:.:.:.  0/0:0:24:0:0,72,991:0,0,24,0,0  0/0:0:4:0:0,12,153:0,0,4,0,0  .:.:.:.:.:.  0/0:0:11:0:0,33,459:0,0,11,0,0  0/0:0:2:0:0,6,84:0,0,2,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:4:0:0,12,163:0,0,4,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr1  214556770  .  C  T  .  PASS  AD=5;DP=11;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  1/1:5:5:0:209,15,0:0,0,0,5,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:5:0:0,15,205:0,5,0,0,0  .:.:.:.:.:.
chr2  24384443  .  C  T  .  PASS  AD=0;DP=6;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,80:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,57:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr2  27248523  .  C  T  .  PASS  AD=3;DP=4;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  1/1:3:3:0:117,9,0:0,0,0,3,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr2  27261942  .  C  T  .  PASS  AD=0;DP=15;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  0/0:0:1:0:0,3,19:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  0/0:0:2:0:0,6,80:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,80:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr2  27306398  .  C  T  .  PASS  AD=0;DP=8;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:4:0:0,12,167:0,4,0,0,0  0/0:0:3:0:0,9,111:0,3,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
chr2  40657149  .  C  T  .  PASS  AD=0;DP=6;OTH=0  GT:AD:DP:OTH:PL:ALL  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:2:0:0,6,84:0,2,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:3:0:0,9,125:0,3,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  0/0:0:1:0:0,3,42:0,1,0,0,0  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.  .:.:.:.:.:.
  • 关于运行问题

    运行主要就是读取数据,绘制热图以及克隆进化树的绘制等分析,以软件包自带的例子为说明输入文件需要以下三个文件:

  1. A:一个整数计数的变异X细胞的矩阵,提供每个细胞中每个变异位点支持变异等位基因的 Reads 数;

  2. D:一个整数计数的变异X细胞的矩阵,提供每个细胞中每个变异位点的Reads数;

  3. Config:一个变异X克隆“配置”矩阵的二进制值提供克隆-变异配置,指出哪些突变预计出现在哪些克隆中。

    配置矩阵 Config 可以由用于推断细胞群的克隆结构的其他工具提供。例如,软件包 Canopy 可用于从 DNA-seq 数据推断克隆进化树,其输出的“Z”元素是配置矩阵。

我们通过112个体细胞突变演示了cardelino, 将77个细胞分配给Canopy鉴定的克隆,如下:

library(ggplot2)
library(cardelino)
vcf_file <- system.file("extdata", "cellSNP.cells.vcf.gz", package = "cardelino")
input_data <- load_cellSNP_vcf(vcf_file)
## Scanning file to determine attributes.
## File attributes:
##   meta lines: 37
##   header_line: 38
##   variant count: 112
##   column count: 86
## 
Meta line 37 read in.
## All meta lines processed.
## gt matrix initialized.
## Character matrix gt created.
##   Character matrix gt rows: 112
##   Character matrix gt cols: 86
##   skip: 0
##   nrows: 112
##   row_num: 0
## 
Processed variant: 112
## All variants processed
## [1] "112 out of 112 SNPs passed."
  • 提供克隆树的克隆ID

我们可以看到突变等位基因的等位基因频率。正如预期的那样,由于 scRNA-seq 数据的高度稀疏性,大部分条目都丢失了(灰色部分)。出于同样的原因,即使没有缺失条目,等位基因频率的估计也具有很高的不确定性。因此,考虑不确定性的概率聚类至关重要,最理想的方法是从外部数据中引导克隆树结构。

AF <- as.matrix(input_data$A / input_data$D)
head(AF)
 ERR2806034 ERR2806035 ERR2806036 ERR2806037 ERR2806038 ERR2806039 ERR2806040 ERR2806041
chr1_19433131_G_A         NaN        NaN        NaN        NaN        NaN        NaN        NaN        NaN
chr1_44437461_A_T         NaN        NaN        NaN          0        NaN        NaN        NaN        NaN
chr1_77558151_G_A         NaN        NaN        NaN        NaN          0        NaN        NaN        NaN
chr1_116944270_C_T          0        NaN          0          0          0          0          0        NaN
chr1_155449828_G_A        NaN        NaN        NaN        NaN          0        NaN        NaN        NaN
chr1_196711163_G_A        NaN        NaN        NaN        NaN        NaN        NaN        NaN        NaN

p = pheatmap::pheatmap(AF, cluster_rows=FALSE, cluster_cols=FALSE,
                       show_rownames = TRUE, show_colnames = TRUE,
                       labels_row='77 cells', labels_col='112 SNVs',
                       angle_col=0, angle_row=0)

图片

  • 关于输入文件格式

Cardelino 输入文件即为上一期 Canopy 获得的文件

canopy_res <- readRDS(system.file("extdata", "canopy_results.coveraged.rds", 
                                  package = "cardelino"))
Config <- canopy_res$tree$Z
#Be careful to ensure that the same variant IDs are used in both data sources.
rownames(Config) <- gsub(":", "_", rownames(Config))
head(Config)
                  clone1 clone2 clone3
chr1_19433131_G_A       0      0      1
chr1_44437461_A_T       0      1      1
chr1_77558151_G_A       0      1      1
chr1_116944270_C_T      0      0      1
chr1_155449828_G_A      0      0      1
chr1_196711163_G_A      0      0      1

#We can visualize the clonal tree structure obtained from Canopy:
plot_tree(canopy_res$tree, orient = "v")

我们可以从 Canopy 看到克隆树的结构, 如下:

图片

所包含的数据集包含A和D矩阵,因此结合所提供的 Canopy tree 对象,我们有必要的输入,以概率地将细胞分配给克隆。注意,min_iter = 800, max_iter = 1200只用于快速演示。请删除默认值或设置更高的迭代次数,以确保 Gibbs 抽样的收敛性。

set.seed(7)
assignments <- clone_id(input_data$A, input_data$D, Config = Config,
                        min_iter = 800, max_iter = 1200)
names(assignments)
head(assignments$prob)
               Clone1       Clone2       Clone3
ERR2806034 1.109086e-18 2.265490e-51 1.000000e+00
ERR2806035 9.999972e-01 9.773705e-30 2.840260e-06
ERR2806036 9.999105e-01 6.410163e-49 8.952580e-05
ERR2806037 9.995705e-01 5.990357e-44 4.294512e-04
ERR2806038 9.999999e-01 3.550719e-49 6.599938e-08
ERR2806039 3.147891e-27 1.159721e-61 1.000000e+00

prob_heatmap(assignments$prob)

图片

  • 关于运行问题

如果最高后向概率大于0.5,我们建议将细胞分配给最高概率克隆,如果细胞未达到这个阈值,则保留细胞“未分配”。assign_cells_to_clone 函数根据阈值方便地将细胞分配给克隆,并返回带有 cell-clone 分配的 data.frame。此外,Cardelino 将更新向导克隆树配置矩阵(作为先验)并返回一个后验估计。在下面的图中,负值表示某一变异在某一克隆中出现的概率在后侧比先验(即输入Config)降低,正的值则相反。

df <- assign_cells_to_clones(assignments$prob)
head(df)
        cell  clone  prob_max
1 ERR2806034 clone2 1.0000000
2 ERR2806035 clone1 0.9999962
3 ERR2806036 clone1 0.9998574
4 ERR2806037 clone1 0.9997119
5 ERR2806038 clone1 0.9999999
6 ERR2806039 clone2 1.0000000

table(df$clone)
 clone1     clone2     clone3 unassigned 
        44         24          7          2 
    
heat_matrix(t(assignments$Config_prob - Config)) + 
  scale_fill_gradient2() +
  ggtitle('Changes of clonal Config') + 
  labs(x='Clones', y='112 SNVs') +
  theme(axis.text.y = element_blank(), legend.position = "right")

图片

最后,我们可以在原始等位基因频率矩阵中可视化细胞分配和更新突变克隆配置的结果:

AF <- as.matrix(input_data$A / input_data$D)
cardelino::vc_heatmap(AF, assignments$prob, Config, show_legend=TRUE)

图片

  • 不输入克隆树的克隆ID

如上所示,可以通过来自 scRNA-seq 数据的观察更新配置。进一步的步骤是不完全包含Config。这是可能的,因为没有可用的克隆树。在这种情况下,您可以通过设置 Config=NULL并为 n_clones 设置一个数字。注意,默认情况下,我们将保留第一个克隆作为基本克隆,即没有突变。你可以通过设置 keep_base_clone=FALSE 来关闭它。

assignments <- clone_id(input_data$A, input_data$D, Config=NULL, n_clone = 3)
Config is NULL: de-novo mode is in use.
112 variants used for cell assignment.

这里要注意的是:通常体细胞突变在 scRNA-seq 数据中的覆盖范围非常稀疏(给定细胞中的大多数突变位点没有 Reads 覆盖),但 Cardelino 模型解释了这种稀疏性,并在所有可用突变位点上聚集信息,以推断克隆进化结构。

Reference:

McCarthy, D.J., Rostom, R., Huang, Y. et al. Cardelino: computational integration of somatic clonal substructure and single-cell transcriptomes. Nat Methods 17, 414–421 (2020).

关注公众号,每日有更新!
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值