RNA-Seq 笔记 [4]

***********************该笔记为初学者笔记,仅供个人参考谨慎搬运代码******************************

samtools 排序压缩和 featureCounts 生成基因计数表

SAM文件和BAM文件

1.SAM格式:是一种通用的比对格式,用来存储reads到参考序列的比对信息,以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。SAM分为两部分,注释信息比对结果部分。
2.BAM格式:SAM的二进制文件,bam文件优点:bam文件为二进制文件,占用的磁盘空间比sam文本文件小;利用bam二进制文件的运算速度快。

#排序压缩步骤
conda info --envs
conda activate py2env
#下载subread
conda install -c bioconda subread
#测试是否成功
featureCounts -h#成功
cd /home/yinwen/biosoft/hisat2
#压缩:把 sam文件 转为 bam文件
samtools view -S genome.sam -b > genome.bam
#排序:samtools sort
samtools sort -n -@ 5 genome.bam -o genome
#计数统计: 
featureCounts -T 5 -t exon -g Parent -a genome.gff -o genome.counts -p genome
#samtools详情:http://www.360doc.com/content/23/0927/14/1098188476_1098188476.shtml

genome.gff 就是最初下载的注释文件,如果要统计多个文件的话,在-p 后面跟上就可以,会生成 genome.countsgenome.counts.summary 两个文件,我们的DG文件也是成功得到如下:

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值