新建一个文件夹作为工作目录,并将数据拷贝进该工作目录。
查看fastq文件:
BWA序列比对:建立索引、比对生成sam文本文件、转化sam文件为较小的bam二进制文件。
sam文件格式为数据的可重复使用性得到了极大的提升。
由于bam文件为二进制文件,所以需要借助samtools进行查看。
查看bam文件命令: samtools view -h [目标文件名] | less -SN
可视化IGV:建立参考序列索引,获取fai文件;
根据alignment position进行排序,即按照比对后序列所在参考序列位置的先后顺序进行排序;
建立目标文件索引,获取bai文件。
打开IGV:
IGV可视化界面:
参考序列:
比对结果:
其中,有颜色的位点代表不匹配的位点。上方的峰值代表该位置匹配到的短序列个数。