生信软件之bwa
一.介绍
BWA是一个针对大型参考基因组(如人类基因组)绘制DNA序列的软件包。它包括三种算法:BWA-backtrack, BWA-SW和BWA-MEM。
二.安装
假设已经按照了Anaconda
conda install bwa
三.建立index
对fasta文件构建FM-index索引:
bwa index -a bwtsw hg19.fa
有两种构建index算法:
-a bwtsw 大的基因组数据,必须大于10MB,比如人的全基因组
-a is 默认的算法,速度较快,需要较大的内存,不能构建大于2GB的数据库
结果如下
hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa
四.比对
对于BWA-backtrack调用aln/samse/sampe,
对于BWA-SW调用bwasw,
对于BWA-MEM算法调用mem。
对于70-100bp Illumina读数,BWA-MEM比BWA-backtrack有更好的性能。
所以这里使用的是men,双端测序,"@RG\tID:40\tPL:illumina\tLB:WES\tSM:40"描述信息,加上以免做变异检测可能出错
bwa mem -t 4 -M -R "@RG\tID:40\tPL:illumina\tLB:WES\tSM:40" $index $_1.fastq.gz $_2.fastq.gz > $.sam &
我的博客.