bam文件读取_生物信息学分析实用小技巧(五):BAM/SAM两三事

BAM/SAM文件两三事写在前面的
上期推文主要讲了Linux系统下三种语言环境的管理,R、Perl和Python作为生物信息学中常用的编程语言,但是这三门编程语言的环境在系统中的管理有不相同的地方。Linux系统自带了Perl和Python,但是Linux系统只能支持一个Perl的存在,对于其他如qiime类的软件需要用perl最好把这些软件安装在一个独立的虚拟环境中,对于python由于系统支持多个版本的python所以只需要知道如何快速切换python版本就行。对于R语言,由于大部分系统并不自带这个语言,所以只要选择一个合适的版本安装就行。BAM/SAM文件的细致解读
这期的推文,主要讲述BAM/SAM文件的解读,咱们公众号已经解读过这些文件了。这次我主要从文件的应用角度来讲,一次肯定是讲不完的,为此我专门以这个文件的内容为主体,分多期推文讲述。主要目的在于让大家再次加深对这些文件的映像,同时具有独立的编程能力完成一些分析。其实,BAM文件的爸爸是SAM文件,SAM文件是Sequencing Alignment/Map Format的英文首字母缩写。由于早期NGS分析中序列比对软件多种多样,它们输出的文件也是五花八门。后来李恒大神开发了bwa,这个软件输出的结果是SAM文件。正因为SAM文件的出现使得后来在NGS分析中序列比对的比对信息储存格式标准化。所以不管你现在是做RNAseq还是WGS亦或是其他组学分析如宏基因组等,只要涉及到对高通量数据进行序列比对,就会出现SAM文件。但是,SAM文件因其占用磁盘空间很大,非常不利于数据的储存。李恒大神由在SAM的基础上开发了BAM储存的方式,储存信息和SAM一样,但是大大节约了储存空间。例如当你使用如下命令查看BAM文件时
samtools view xxx.bam | head -n 100

0ec4c1f1d3fd7c48d8e3f0a396e22628.png


这个结果看上去十分复杂,其实我们公众号已经网上都有资料讲过这里是按照如下信息分隔的

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值