1 介绍
- Samtools是一个用来处理SAM/BAM(SAM的二进制格式,用于压缩空间)格式的比对文件的工具,它能够输入和输出SAM(sequence alignment/map:序列比对)格式的文件,对其进行排序、合并、建立索引等处理。排序后的 .bam用于后续转录本的组装与定量。
2 安装
conda install samtools
samtools
3 使用
3.1 SAM格式转为BAM格式
cd bwa_test/
samtools faidx GCA_000012525.1_ASM1252v1_genomic.fna
less GCA_000012525.1_ASM1252v1_genomic.fna.fai
samtools view -bhS -t GCA_000012525.1_ASM1252v1_genomic.fna.fai -o PCC7942_bwa.bam test_bwa_7942.sam
less PCC7942_bwa.bam
samtools sort PCC7942_bwa.bam -o PCC7942_bwa.bam.sorted
samtools index PCC7942_bwa.bam.sorted
3.2 查看比对结果
samtools tview PCC7942_bwa.bam.sorted GCA_000012525.1_ASM1252v1_genomic.fna
$ samtools view [options] <输入bam文件>
-b 以bam格式输出
-u 以未压缩的bam格式输出,一般与linux命令配合使用
-h 在sam输出中包含header信息
-H 只输出header信息
-f [INT] 只输出在比对flag中包含该整数的序列信息
-F [INT] 跳过比对flag中含有该整数的序列
-o [file] 标准输出结果文件
3.3 Bam2Pileup
samtools mpileup -f GCA_000012525.1_ASM1252v1_genomic.fna PCC7942_bwa.bam.sorted >mpileup.txt
less mpileup.txt