1。下载与安装
https://www.openbioinformatics.org/annovar/annovar_download_form.php
在这个链接中下载软件,只不过需要教育类的邮箱。
然而,我已经毕业了,刚刚看了一下苏大邮箱过期了,悲剧。
但是,我找了同学的邮箱,于是获取到了下载链接。
下载链接:http://www.openbioinformatics.org/annovar/download/0wgxR2rIVP/annovar.latest.tar.gz
下载完成之后,存放在workplace中
解压即可使用:
tar -zxvf annovar.latest.tar.gz
2。下载注释数据库
已有数据库查询链接:https://annovar.openbioinformatics.org/en/latest/user-guide/download/
以下六个数据库是完成谱系追踪必须要求的。
-
refGene(已经有了hg19_refGene.txt)
-
ljb26_all
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar ljb26_all humandb/
-
cosmic70
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar cosmic70 humandb/
-
esp6500siv2_all
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar esp6500siv2_all humandb/
-
exac03
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar exac03 humandb/
-
1000g2015aug
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar 1000g2015aug humandb/
运行起来稍微有点慢。
非常慢,因为一个注释的数据库真的特别大。
当看到官网上说一个库的大小就要~200GB的时候,我放弃了。
NOTE: several whole-genome databases (cadd, cadd13, fathmm, dann, eigen, gerp++, etc.) are available for download after server migration in June 2019. Please do NOT download unless you absolutely need to use them in your whole genome analysis (note that each file is ~200GB in your local computer), since each download will cost me a few dollars now.