linux查看bam文件格式,bam格式文件处理大全(四)

sam文件是短序列比对生成的文件,是二代测序中最核心的文件。在RNAseq,变异检测等分析中,都需要首先生成sam文件格式。bam文件是sam格式的二进制格式,转换为二进制之后,可以减小文件的存储。掌握sam/bam文件的操作是处理二代测序数据的非常重要的内容,例如sam与bam的转换,排序,建立索引,reads计数等等操作。

16 统计bam并绘图

samtools stats  A1.sorted.bam  >A1.stats

plot-bamstats -p test  A1.stats

17 过滤数据

sam或bam文件包含了所有测序数据与参考序列的比对情况,包括没有比对上的,有时候需要比对完,将数据进行过滤,例如,将没有比对上的reads输出出来,或者将比对上的reads输出出来,这些操作都可以通过samtools view功能进行处理。view功能中包含了-f与-F选项,可以对比对进行过滤,给定flag值即可。#将没有比对上的reads筛选出来

samtools view -f 4 A1.sorted.bam

#将比对上的reads输出出来

samtools veiw -F 4 A1.sorted.bam

18 输出比对fq或fa

samtools view过滤输出的是sam或者bam格式,有时候需要输出fastq或者fasta格式,samtools可以很方便的进行处理。samtools fastq可以直接输出fastq格式,这样数据可以直接进行拼接,samtools fasta直接输出fasta,这样可以直接进行blastn比对。注意,如果输出的不是成对比对的结果,就无法进行转化为reads1与reads2,而只能是一个文件。

samtools fastq A1.sorted.bam -1 A.1.fq.gz -2 A.2.fq.gz -c 6

19 tview

samtools 也可以通过自带的tview功能查看每个位点的细节,使用起来并不难,首先需要排序建立索引的reads,然后是建立索引的参考序列。samtools tview A1.sorted.bam

samtools tview A1.sorted.bam ref.fna

168972822_1_20190821085213160

20 tablet 可视化

tablet可以可视化bam文件,输入文件为排序建索引的bam以及建立索引的参考序列,和samtools tview输入文件一致。tablet工具支持windows,Linux,macos等多个版本。

168972822_2_20190821085213300

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值