主页使用说明http://snpeff.sourceforge.net/SnpEff_manual.html。
下载解压即可使用(java)。
一、建库
(1)已有2500个基因组的库,直接下载。
查看已有库:$ java -jar snpEff.jar databases
下载库:$ java -jar snpEff.jar download -v GRCh37.75
(2)自己建库
1. Configure a new genome:编辑:$ vi snpEffect.config
# Mouse genome, version mm37.61
mm37.61.genome : Mouse
2. 如果是其他编码格式,如线粒体:dm3.M.codonTable : Vertebrate_Mitochondrial (基因组dm3,染色体M)
3. 建库:
$ mkdir snpEff/data/mm37.61
$ cd snpEff/data/mm37.61
将基因组数据 Mus_musculus.NCBIM37.61.dna.toplevel.fa.gz 改名为 sequences.fa
将基因组注释数据 dmel-all-r5.31.gff.gz 改名为 genes.gff.gz (注:如果GFF3文件已经含有fasta序列,则在前面加 '##FASTA')
还可以将protein.fa.gz、cds.fa.gz、regulation.gff.gz放入。
$ cd snpEff
$ java -jar snpEff.jar build -gff3 -v mm37.61
(3)注释
$ java -Xmx4g -jar snpEff.jar mm37.61 test.chr22.vcf > test.chr22.ann.vcf
$ java-Xmx15G -jar../snpEff_3_1/snpEff.jar eff -v galGal4-c ../snpEff_3_1/snpEff.config -i vcf stop_gained.vcf > stop_gained.anno