https://www.jianshu.com/p/6284f57664b9
目前对于variant进行注释的软件主要有4个: Annovar
, SnpEff
, VEP(variant Effect Predictor)
, Oncotator
, 选择合适的软件注释variants对于下游分析是很关键的, 今天我们来比较下这4种软件在variants 注释上的差异,进而帮助我们选择更合适的注释软件.
首先简要介绍下这4个软件的一些特点:
Oncotator
: 主要用于癌症特异性突变位点的注释,下面不做过多解释.注释结果为MAF格式(也是TCGA使用的突变注释格式),也可以用于格式转换(将VCF文件转为MAF格式).但基因组文件使用的是hg19(GENCODE)版本,截止到目前并没有更新到GRCh38.(基于python)SnpEff
: 支持超过38000个基因组, 并且目前已经支持肿瘤突变分析.之前是与gatk不兼容的,但现在已经修复.并且还有衍生工具SnpSift
用于过滤和操作SnpEff
的结果文件(VCF格式).现在还发布了集成了SnpEff
和Snpsift
的专业版软件ClinEff
,这个主要是面向临床和精准医疗的.(基于java)Annovar
: 也支持多个基因组(包括 hg18, hg19, hg38,也有小鼠,虫等物种),能够确定SNP或CNV是否导致蛋白质编码变化以及受影响的氨基酸,并且能够自主的选择基因定义系统(如RefSeq/UCSC/Ensemble等).也能识别特定基因组区域的variants,如保守性区域,TFBS,DHS,组蛋白结合修饰区域. 也能关联其他数据库对variants进行注释,如dbSNP/1000 Genome Project等. 还能检索用户自定义的基因组位置,识别孟德尔疾病的可能的基因列表.(基于perl)VEP(Variant Effect Predictor)
: 最初发布于2010年(PMID:20562413),16年(PMID:27268795)时又发布了新的版本做了很大改进,现在主要可以进行序列变异和结构变异注释.(基于perl)
Software | citation | Journal | IF | Year | Pebmed ID |
---|---|---|---|---|---|
snpEff | 1,232 | FLY | 0.9 | 2012 | 22728672 |
Annovar | 1814 | NAR | 10 | 2012 | 20601685 |
VEP | 80 | Genome Biol | 11.3 | 2016 | 27268795 |
运行时间的比较: