featureCounts进行转录本定量

featureCounts是subread软件包中的一种工具,主要用来计算subread比对之后的结果进行reads计数,目前比较常用的reads计算工具有两款,一个是HTseq,另一款就是featureCounts。reads 记数主要用在RNAseq分析中。一般在利用R语言进行RNAseq数据分析时,输入文件基本上都是reads count结果。例如DEseq,DEseq2,edgeR,limma等R包,都需要输入这样的结果,不能直接输入归一化之后的结果,因为这些软件都需要使用自己归一化的方法。

Subread软件包是处理下一代测序数据的工具包。它包括子读取对齐器、虚拟外显子-外显子连接检测器和featureCounts读取摘要程序。

1. 下载安装subread

conda 安装,先安装conda环境,激活。

conda install subread

源码下载编译安装  Subread download | SourceForge.net

2. 转录本定量

  • bam文件可以一个或多个。
  • 可以写成脚本,批量处理。
gft_file="/path/to/your/gtf/file"
bam_file1="/path/to/your/bam/file1"
bam_file2="/path/to/your/bam/file2"

featureCounts -t exon -g gene_id -a ${gft_file} -o counts.txt ${bam_file1}

# 去除首行,#开头,其余行保留基因名,长度和read数。
awk 'BEGIN{FS=OFS="\t"}!/#/{print $1,$6,$7}' counts.txt >counts.txt.simple

3. 下游分析

读入R成数据框,再用DESeq2包的DESeqDataSetFromMatrix函数读入生成DESeqDataSet对象,进行下游差异表达分析。

参考

http://subread.sourceforge.net/featureCounts.html​​​​​​​
 

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
featurecounts 是一个用于计算基因或转录本在高通量测序数据中的映射reads数目的工具。它可以帮助分析人员快速而准确地统计每个基因在样本中的表达水平,并提供详细的计数统计结果。 使用 featurecounts,首先需要准备好测序数据的比对结果文件(通常是BAM格式),以及基因或转录本的注释文件(GTF格式)。然后,使用 featurecounts 对比对结果进行计数操作。featurecounts 会根据比对结果和注释文件,将每个read映射到相应的基因或转录本,并计算每个基因或转录本的计数数目。计数结果可以表示为每个基因在每个样本中的计数矩阵。 featurecounts 支持多种计数模式,包括计算所有read的比对位置,计算不重复的read的比对位置,以及计算过滤后的非重复read的比对位置等。这样可以根据具体需要灵活选择合适的计算模式。featurecounts 还支持多种测序平台,包括RNA-seq、chip-seq、miRNA-seq等。 通过 featurecounts 得到的计数结果可以用于后续的差异表达分析、富集分析、聚类分析等。它提供了简单易用的命令行和图形界面,具有高效、准确和可靠的特点,因此被广泛应用于生物学研究中。 总之,featurecounts 是一个功能强大的工具,可以帮助研究人员在高通量测序数据分析中快速、准确地计算基因或转录本的映射reads数目,为后续的功能分析提供重要的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值