0.svim-asm 介绍
svim-asm是一个基于基因组比对鉴定SV的软件,于2020年发布在Bioinformatics上(doi:10.1093/bioinformatics/btaa1034)。Github地址为eldariont/svim-asm: Structural Variant Identification Method using Genome Assemblies (github.com)svim-asm支持的SV种类有6种,分别为Deletion,Insertion,Inversion,Tandem Duplication,Interspersed Duplication 和 Translocation。
svim-asm的特点是支持单倍型基因组的SV鉴定。
1.svim-asm 安装
第一种安装方式 pip:
git clone https://github.com/eldariont/svim-asm.git
cd svim-asm
pip install .
第二种,用conda:
conda install --channel bioconda svim-asm
2.只有一个杂合的quary基因组
首先使用minimap2将quary基因组比对到参考基因组上
参考基因组:reference.fa
quary的基因组:accession.fasta
minimap2 -a -x asm5 --cs -r2k -t 30 <reference.fa> <accession.fasta> |samtools view -bS - |samtools sort -@ 30 -o $accession.bam
samtools index $accession.bam
之后使用svim-asm call SV
svim-asm haploid <working_dir> <$accession.bam> <reference.fa>
最后将会在working_dir生成variants.vcf的文件,就是结果vcf文件。
此外还会生成一个具有结果统计的PNG图片以及log文件。
3.具有两个单倍型的quary基因组
首先是将两个单倍型基因组分别比对到参考基因组上:
minimap2 -a -x asm5 --cs -r2k -t 30 <reference.fa> <accession.hap1.fasta> |samtools view -bS - |samtools sort -@ 30 -o $accession.hap1.bam
samtools index $accession.hap1.bam
minimap2 -a -x asm5 --cs -r2k -t 30 <reference.fa> <accession.hap2.fasta> |samtools view -bS - |samtools sort -@ 30 -o $accession.hap2.bam
samtools index $accession.hap2.bam
之后运行svim-asm:
svim-asm diploid <working_dir> <$accession.hap1.bam> <$accession.hap2.bam> <reference.fa>
同样是在working_dir生成variants.vcf的文件,就是结果vcf文件。