对于STAR比对软件中--outSAMtype BAM SortedByCoordinate的一点浅显认识
这个选项中使用了两个参数,一个是以BAM形式生成比对的结果文件,另外一个是对比对结果进行排序。
插入链接与图片
排序前:可以看到比对结果的第一列的信息是一样的,第三列的比对上的染色体信息是无序的,即未经排序的比对结果文件实际是按照STAR比对时的先后顺序写入的文件。
排序好的比对结果文件:结合第3、4列信息可以看出STAR是以比对到参考基因组的位置进行排序。
###### 那么排序是否会造成信息的丢失呢?
我们可以直接看一下文件的行数:wc -l
排序前的文件行数
排序后的文件行数
完全一样,没有任何信息的丢失。