sam格式总结

SAM文件一共有12列,第1-11列是固定的内容,第12列是可变的内容。(虽然BAM格式是SAM格式的二进制版本,但SAM的坐标起始位置是1,而BAM格式的坐标起始位置是0)。

在这里插入图片描述

BAM格式的一行(用samtools view打开看到的):

在这里插入图片描述

对应的SAM格式中这一行

在这里插入图片描述

Note: 虽然BAM格式储存的是0起始的坐标,我们用samtools打开看到的是1起始的。

Note:正常来说,read1和read2应该比对到参考基因组的不同链上。

1,第一列:测序得到的reads的名字(fastq文件第一行的部分),PE测序的read 1和read 2会以同样的名字出现。

2,第二列为整数,解释如下:

1 : 代表这个序列采用的是PE双端测序

2: 代表这个序列和参考序列完全匹配,没有错配和插入缺失

4: 代表这个序列没有mapping到参考序列上

8: 代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没有比对到参考序列上

16:代表这个序列比对到参考序列的负链上

32 :代表这个序列对应的另一端序列比对到参考序列的负链上

64 : 代表这个序列是R1端序列, read1;

128 : 代表这个序列是R2端序列,read2;

256: 代表这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其他都是次要的

73 = 64+8+1 (R1匹配上,R2没有匹配上)

153 = 128+16+8+1(R2比对到负链接,R1没有匹配上)

97 = 64+32+1 (是R1,R2比对到负链)

99 = 64+32+2+1 (是R1且完全匹配,R2比对到负链)

147 = 128+16+2+1 (是R2且完全匹配到负链)

145 = 128+16+1 (是R2且比对到负链)

81 = 64+16+1(是R1,比对到参考基因组负链)

83 = 64+16+2+1 (R1完全匹配到负链)

161 = 128+32+1(是R2,R1比对到负链)

163 = 128+32+2+1(R2完全匹配,R1比对到负链)

第三列:染色体名字

第四列:比对的起始位置

第五列:比对结果的质量值

. MAPQ: MAPping Quality. It equals −10 log10 Pr{mapping position is wrong}, rounded to the nearest integer. A value 255 indicates that the mapping quality is not available.

第六列:详细比对信息

在这里插入图片描述

第七列:read 2的比对信息。一般是*(代表没有这个信息)或者=(代表跟read1比对到同一个染色体上)。

比对结果中,read1和read2会相互记录对方的信息,下面是一个比对结果的例子:
read1:
在这里插入图片描述
read2:
在这里插入图片描述

第八列:在第七列是=的情况下,这里的整数为read 2比对位置在染色体上的起始位置。其他情况下,这里标记为0。

第九列:带符号的插入片段的长度。大部分情况下,该列的值表示第8列减去第4列加上第6列的值(有soft-clipped bases时额外考虑)。在该信息缺失情况下用0表示。

计算方法如下图(目前采用TLEN#2):
在这里插入图片描述

Note:如果read1或者read2在更靠近参考基因组左边(位置坐标值小),则它是负的值,反之则为正值。

第十列:比对上的位置处参考基因组的序列。如果某条reads跟参考基因组一样,则储存它本身,如果跟参考基因组的互补链一样,则储存它的互补链(有突变之类的情况单独考虑)。

比对后bam文件储存的序列信息:
在这里插入图片描述

read1的 fastq序列:
在这里插入图片描述
read2的 fastq序列:
在这里插入图片描述

第十一列:每一个碱基的测序质量值信息

在这里插入图片描述

第十二列:

在这里插入图片描述
在这里插入图片描述

Reference

https://blog.csdn.net/weixin_34124577/article/details/92403854
https://blog.csdn.net/sinat_32872729/article/details/104857278

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值