bowtie2是当前最流行的短序列比对软,SAM(SequenceAlignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。
主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多
重比对结果
SAM分为两部分:注释信息和对比结果
注释信息以@开头
@HD:说明符合标准的版本。对比序列的排列顺序
@SQ:参考序列说明
@RG:比对上的序列(read)说明
@PG:使用的程序说明
@CO:任意的说明信息
比对结果部分
每一行代表一个片段的比对信息,包括11个必须的字段和一个可选字段,字段之间用tag分割
11个必须字段:
1:比对片段(read)的编号
2.位标识(flag)每一种数字代表一种情况,这里的值是符合情况的数字和
3.参考序列的编号,没有比对上的序列,这里为 *
4.比对上的位置 从1开始计数,没有比对上此处为0
5.MAPQ:mapping的质量
6.CIGAR:简要比对信息表达式 以参考序列为基础,使用数字加字幕表示比对结果
比如3S6M1P1I4M,前三个碱基被剪切去除了,然后6个比对上了,
然后打开了一个缺口,有一个碱基插入,最后是4个比对上了,是按照顺序的
<