2019年5月30日,晚上,心情变好,好几天没更新了,看到男朋友在学一款软件,我也近朱者赤,来继续注释Day2-2中NGS分析流程中的一个重要软件——BWA
NGS基础
NGS分析注释
BWA
对应于NGS分析流程的这两步:
BWA是目前常用的将测序回来的reads比对到参考基因组上的软件,简单来说,参考基因组相当于一整块已知的地图,而reads是被切碎的,与已知地图存在少量区别的地图碎片,而BWA要做的就是找到两者之间的相似信息,并将地图碎片拼到已知地图上去。
关于BWA的使用贴来“庐州月光”(他可能喜欢听许嵩的歌)的这篇简书https://www.jianshu.com/p/1552cc6ac3be,明天再参考多几篇博文和实验室常用脚本,进行详细说明。
1. 首先BWA包含了以下3种算法
BWA-backtrack
BWA-SW
BWA-MEM
BWA-backtrack适合比对长度不超过100bp的序列;BWA-SW和BWA-MEM适合于长度为70-1M bp的序列;其中BWA-MEM是最新开发的算法,对于高质量的测序数据,其比对的速度更快,精确度更高,对于70-100bp的reads, BWA-MEM算法在比对长度为70-100bp的序列时,效果比BWA-backtrack 算法的效果更好。总而言之,通常情况下,选择BWA-MEM算法就好。
2. bwa 的源代码存储在github上,链接如下
https://github.com/lh3/bwa
安装过程如下:
git clone https://github.com/lh3/bwa.git
cd bwa
make
安装好之后,会出现一个名为bwa的可执行文件,输入下面命令可以查看帮助信息
./bwa
Program: bwa (alignment via Burrows-Wheeler transformation)
Version: 0.7.17-r1188
Contact: Heng Li <<a href="mailto:lh3@sanger.ac.uk" _href="mailto:lh3@sanger.ac.uk">lh3@sanger.ac.uk</a>>
Usage: bwa <command> [options]
Command: index index sequences in the FASTA format
mem BWA-MEM algorithm
fastmap identify super-maximal exact matches
pemerge merge overlapping paired ends (EXPERIMENTAL)
aln gapped/ungapped alignment
samse generate alignment (single ended)
sampe generate alignment (paired ended