一、stringtie计算基因和转录本的FPKM
1.1转录组组装
#确认安装了stringtie
#确认产生了排序的bam文件,sorted.bam
#提前安装prepDE.py,可以对stringtie输出文件进行定量
wget http://ccb.jhu.edu/software/stringtie/dl/prepDE.py3
将prepDE.py3放入./home/lumino/tool
#1.转录本组装
#在./SRR3418005/FPKM文件夹中输出转录本组装结果
mkdir ./SRR3418005/FPKM
#转录本组装,这里关注新转录本,使用之前merged.gtf
stringtie -e -p 8 -G ./stringtie-merged.gtf.gtf -A ./SRR3418005/FPKM/SRR3418005.gene.gtf -o ./SRR3418005/FPKM/SRR3418005.transcripts.gtf ./SRR3418005.sorted.bam
-
-e
:这个选项告诉 stringtie
不仅要输出组装得到的转录本,还要输出那些表达量较低、可能不被认为是完整转录本的“额外”转录本片段。这有助于捕获那些可能只部分被测序覆盖的转录本区域。
-
-p 8
:这个选项指定了 stringtie
在执行时应使用的线程数。在这里,-p 8
表示使用两个线程,这可以加速计算过程,特别是在处理大型数据集时。
-
-G ./stringtie-merged.gtf
:这里 stringtie-merged.gtf,是所有样本转录本组装并整合的gtf
。这个文件包含了所有样本的基因和转录本的结构信息。如果不关注新转录本,可以使用基因组注释文件tair10.gtf
-
-A SRR3418005.gene.gtf
:这个选项指定了一个输出文件的路径和名称,该文件将包含基于转录本组装结果推导出的基因级别的丰度信息。在这里,输出文件名为 SRR3418005.gene.gtf
。
-
-o /SRR3418005/FPKM/SRR3418005.transcripts.gtf