【定量工具-featureCounts安装及使用】零基础看懂运行代码,报错大赏Q&A

接上文:STAR比hisat2更好;hisat2快一些得花几个小时

featureCount是subread软件包里的一个命令,所以安装subread即可。
官网(Subread download | SourceForge.net)下载subread-2.0.3-Linux-x86_64.tar.gz压缩文件
wget https://sourceforge.net/projects/subread/files/subread-2.0.6/subread-2.0.6-Linux-x86_64.tar.gz/download
tar -zxvf进行解压,进入bin/目录,目录下featureCounts就可直接运行

#找到featureCount位置:/home/data/t210451/miniconda3/pkgs/subread-2.0.6-Linux-x86_64/bin

#每次/临时添加环境变量:
export PATH=/home/data/t210451/miniconda3/pkgs/subread-2.0.6-Linux-x86_64/bin:$PATH

#下载注释文件gencode.v29.annotation.gtf.gz

#查看当前文件夹下所有bam文件
ls -lh /home/data/t210451/RNAseq/fhdata/fhclean/trim-galore/fastp/aligned/bam/*.bam
dirlist=$(ls -t /home/data/t210451/RNAseq/fhdata/fhclean/trim-galore/fastp/aligned/bam/*.bam |tr '\n' ' ')
echo $dirlist
featureCounts -a /home/data/t210451/RNAseq/fhdata/fhclean/aligned/bam/gencode.v29.annotation.gtf.gz -o /home/data/t210451/RNAseq/fhdata/fhclean/trim-galore/fastp/aligned/bam/6_final_counts.txt -g 'gene_name' -T 8  -p $dirlist

报错:Paired-end reads were detected in single-end read library——加-p

https://www.reddit.com/r/bioinformatics/comments/13m89bd/help_with_featurecounts_error_pairedend_reads/?rdt=47295#从featureCounts输出文件中获取counts与TPM矩阵 RNA-seq入门实战(三):在R里面整理表达量counts矩阵-腾讯云开发者社区-腾讯云 (tencent.com)

####有个问题

cd /home/data/t210451/RNAseq/zzdata/zzclean/fastp/aligned/sambam
#进入生成的6_final_counts.txt.summary文件夹所在目录
multiqc 6_final_counts.txt.summary
#整合后看匹配的reads比例和数量

file:///D:/%E8%B0%B7%E6%AD%8C%E4%B8%8B%E8%BD%BD/multiqc_report.html

#不对劲,特别少

#发现featureCounts比对的GRCh38是human的!!!!gencode.v29.annotation.gtf.gz

### 重新下载注释文件并且重新比对(老鼠的应该是GRCm38=mm10

#下载mouse的注释文件:GENCODE - Mouse Release M33

 #上传后重新比对,看multiqc结果

#增加了一些,但不多。。。。。哪里出问题了呢?之前,我的参考基因文件(我是在ncbi下载的)和注释文件(genecode网站)下载的? 保姆级参考基因组及其注释下载方法(图文详解) - 知乎 (zhihu.com)

在同一个网站下载fasta

1、 读取counts.txt构建counts矩阵;

2、样品的重命名和分组;

3、counts与TPM转换;

4、基因ID转换;

5、初步过滤低表达基因与保存counts数据

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
featurecounts 是一个用于计算基因或转录本在高通量测序数据中的映射reads数目的工具。它可以帮助分析人员快速而准确地统计每个基因在样本中的表达水平,并提供详细的计数统计结果。 使用 featurecounts,首先需要准备好测序数据的比对结果文件(通常是BAM格式),以及基因或转录本的注释文件(GTF格式)。然后,使用 featurecounts 对比对结果进行计数操作。featurecounts 会根据比对结果和注释文件,将每个read映射到相应的基因或转录本,并计算每个基因或转录本的计数数目。计数结果可以表示为每个基因在每个样本中的计数矩阵。 featurecounts 支持多种计数模式,包括计算所有read的比对位置,计算不重复的read的比对位置,以及计算过滤后的非重复read的比对位置等。这样可以根据具体需要灵活选择合适的计算模式。featurecounts 还支持多种测序平台,包括RNA-seq、chip-seq、miRNA-seq等。 通过 featurecounts 得到的计数结果可以用于后续的差异表达分析、富集分析、聚类分析等。它提供了简单易用的命令行和图形界面,具有高效、准确和可靠的特点,因此被广泛应用于生物学研究中。 总之,featurecounts 是一个功能强大的工具,可以帮助研究人员在高通量测序数据分析中快速、准确地计算基因或转录本的映射reads数目,为后续的功能分析提供重要的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值