比对软件
来啦@-@,今天给大家分享一下几款小编常用的比对软件。
Bwa
适用范围:二代测序数据快速比对到genome上。
bwa作为序列比对界的模式软件,短小精悍,适用于多种场合,很有必要搞懂他内部的比对算法,最好也搞懂它是如何实现的。
建立索引:
bwa index in.fasta
索引建立好之后会生成五个文件,后缀分别是:
bwt,pac,ann,amb,sa
常见比对命令:
BWA-backtrack:illumina reads比对,最长支持100bp(aln/samse/sampe)
bwa aln ref.fa R1.fq > aln1_sa.sai
bwa aln ref.fa R2.fq > aln2_sa.sai
bwa sampe ref.fa aln_sa1.sai aln_sa2.saiR1.fq R2.fq > aln-pe.sam
BWA-SW:long-read比对,长度为70bp-1Mbp;支持剪切性比对(bwasw)
bwa bwasw ref.fa R1.fq R2.fq > aln-pe.sam
BWA-MEM:最新,最常用,同SW,但更准更快,与backtrack相比在70-100bp更具性能优势(mem)
bwa mem ref.fa R1.fq R2.fq > aln-pe.sam
Bowtie/Bowtie2
适用范围:将短序列拼接至模板基因组。
Bowtie在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度。Bowtie并不是一个简单的拼接工具,它不同于Blast等。它适合的工作是将小序列比对至大基因组上去。它最长能读取1024个碱基的片段。换言之,bowtie非常适合下一代测序技术。
Bowtie2 是将测序reads与长参考序列比对工具。适用于将长度大约为50到100或1000字符的reads与相对较长的基因组(如哺乳动物)进行比对。Bowtie2使用FM索引(基于Burrows-Wheele