samtools 使用简述

功能如下:

1、View

  主要功能讲sam文件转位bam文件。

      涉及的参数:

  -b 输出bam格式。。默认是sam文件

  -h 输出的sam文件带header。。默认不带

  -H 仅仅输出header

  -S 输入sam文件。。默认bam文件

  -u 输出bam文件不进行压缩。。必须有-b参数

  -c 输出比对上的数

  -f 输出含有所有flag都reads

  -F 输出没有flag的reads。。数字4代表改reads没有比对上,数字8表示mate序列没有比对上

  -q 比对的最低质量值。。一般20就可以

  例子:

  1⃣️ sam文件转位bam文件:samtools view -bS file.sam > file.bam

          bam转sam:samtools view -h -o file.sam file.bam

      2⃣️ 提取比对到参考基因组上的reads:samtools view -bF 4 file.bam > file.F.bam。。若提取两条reads都比对上,则F值设计为12。 4+8

  3⃣️ 提取bam文件中比对到chr3的结果,并以sam文件保存:samtools view file.bam chr3 > chr.sam






2、sort

  用法:samtools sort [-n] [-m] <in.bam> <out.bam>

  -m 内存参数默认下500,000,000 即500M(不支持M,G等缩写)

  -n 设定排序方式按short reads 的ID排。默认按照fasta在文件中的顺序

      例子:samtools sort accepted.bam accepted.sort.accepted.sort.bam

 3、merge

  将2个或者2个以上已经sort过的bam文件进行合并。

  samtools merge <out.bam> <in1.bam> <in2.bam> [....]

4、index

  必须对bam文件sort后在可以进行index。建立索引后生成.bai的文件。用于快速的随机处理。如tview等。

   samtools index <in.bam> <out.index> 

  以下两种都可以:

  samtools index file.sort.bam

  samtools index file.sort.bam file.sort.bam.bai

5、faidx

  对fasta文件建立索引,生成.fai文件。可以快速提取fasta文件中的某一序列

  samtools faidx genome.fasta

  提取序列:

  samtools faidx genome.fasta scafold10 > scafold10.fasta

6、tview

  smatools tview <file.bam> [ref.fasta]

  第一排位参考基因组序列,否则为N。按下g可以输入要到达基因组的某一位点,如:“chr3:1000” 3号人色体1000位。”.“切换显示碱基和点号,用“r”显示read name 等

7、flagstat

  samtools flagstat <in.bam>  

 

  待续。。。。。

 https://blog.csdn.net/sinat_38163598/article/details/72910115

转载于:https://www.cnblogs.com/zhanmaomao/p/9410457.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值