Linux的RNA-seq分析（stringtie-FPKM和HTseq计数）

Luminosite Eternelle

已于 2024-03-21 00:11:51 修改

阅读量2.9k

点赞数 17

文章标签： linux 数据库运维

于 2024-03-15 21:19:56 首次发布

本文链接：https://blog.csdn.net/weixin_43927366/article/details/136721359

版权

一、stringtie计算基因和转录本的FPKM

1.1转录组组装

#确认安装了stringtie
#确认产生了排序的bam文件，sorted.bam
#提前安装prepDE.py，可以对stringtie输出文件进行定量
 wget http://ccb.jhu.edu/software/stringtie/dl/prepDE.py3
 将prepDE.py3放入./home/lumino/tool

#1.转录本组装
#在./SRR3418005/FPKM文件夹中输出转录本组装结果
 mkdir ./SRR3418005/FPKM
#转录本组装，这里关注新转录本，使用之前merged.gtf
stringtie -e -p 8 -G ./stringtie-merged.gtf.gtf -A ./SRR3418005/FPKM/SRR3418005.gene.gtf -o ./SRR3418005/FPKM/SRR3418005.transcripts.gtf ./SRR3418005.sorted.bam

-e：这个选项告诉 stringtie 不仅要输出组装得到的转录本，还要输出那些表达量较低、可能不被认为是完整转录本的“额外”转录本片段。这有助于捕获那些可能只部分被测序覆盖的转录本区域。
-p 8：这个选项指定了 stringtie 在执行时应使用的线程数。在这里，-p 8 表示使用两个线程，这可以加速计算过程，特别是在处理大型数据集时。
-G ./stringtie-merged.gtf：这里 stringtie-merged.gtf，是所有样本转录本组装并整合的gtf。这个文件包含了所有样本的基因和转录本的结构信息。如果不关注新转录本，可以使用基因组注释文件tair10.gtf
-A SRR3418005.gene.gtf：这个选项指定了一个输出文件的路径和名称，该文件将包含基于转录本组装结果推导出的基因级别的丰度信息。在这里，输出文件名为 SRR3418005.gene.gtf。
-o /SRR3418005/FPKM/SRR3418005.transcripts.gtf