有参组装新转录本cufflinks_转录组组装软件stringtie

StringTie是一款高效的转录组组装软件,优于cufflinks,广泛应用于有参考基因组的转录组研究。本文介绍了StringTie的下载、使用方法及参数解释,包括对已知基因的定量分析和新转录本的组装,并提到了转录本合并功能。
摘要由CSDN通过智能技术生成

StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件。

软件的下载

wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.6.Linux_x86_64.tar.gz

tar zxvf stringtie-1.3.6.Linux_x86_64.tar.gz

StringTie 使用说明:新版本更新之后去掉了一些参数

stringtie [-G ] [-l ] [-o ] [-p ]

[-v] [-a ] [-m ] [-j ] [-f ]

[-C ] [-c ] [-g ] [-u]

[-e] [-x ] [-A ] [-h] {-B | -b }

选项:

--version : 输出软件的版本信息

-G 参考序列的基因注释文件 (GTF/GFF3)

-l 输出转录本的名称前缀 (default: STRG)

-f 最少转录本的比例 (default: 0.1)

-m 组装转录本的最小长度 (default: 200)

-o 组装转录本的GTF注释文件 (default: stdout)

-a 连接位点锚定序列的最小长度 (default: 10)

-j 连接位点的最小覆盖度 (default: 1)

-t 基于覆盖度对预测的转录本进行修正 (default: coverage trimming is enabled)

-c 组装转录本的reads最小覆盖度(default: 2.5)

-v 输出log 信息

-g 比对上的reads 间距大于阀值则新城一个新的转录束 (default: 50)

-C 输出参考转录本中被reads 覆盖到的转录本

-M 转录束允许多比对reads覆盖的最大占比 (default:0.95)

-p 线程(CPU)数 (default: 1)

-A 基因丰都输出文件

-B 在输出的GFT同目录下输出Ballgown table 文件

-b 在 目录下输出Ballgown table 文件

-e 只对参考转录本进行丰都评估 (requires -G)

-x 不在参考序列区域组装任何的新转录本

-u 多比对校正 (default: correction enabled)

-h 输出软件的帮助信息

软件的使用

如果是只需要对已知的基因进行定量使用下面的命令

stringtie -p 18 -G Homo_sapiens.GRCh38.89.protein_coding.gtf -B -e -o Ctrl-1.gtf -A Ctrl-1_abundance.txt -l Ctrl-1 Ctrl-1.bam

使用的参数说明

-p 设置运行的线程数

-G 设置GTF基因组注释文件

-B 在GTF的输出目录下输出ballgown table文件,用于使用ballgown table进行差异表达分析

-e 只对参考转录本进行丰度的计算,需要提供GTF注释文件

-o 输出生成的GTF注释文件

-A 输出基因的丰度计算结果

-l 设置前缀名

最后接输入的bam文件,输入的bam文件是要排序之后的文件,一般是默认按照染色体顺序排序

如果是需要组装新的转录本使用下面的命令

stringtie CM11.bam -G CM.gtf -o CM11.gtf -f 0.3 -j 3 -c 5 -g 100 -s 10000 -p 24

使用的参数说明

-f 最少的转录本比例

-j 连接位点的最小长度

-c 组装的转录本的最小read覆盖度

-g 比对上的reads 间距大于阀值则新城一个新的转录束

-s 新版已经没有了这个参数,主要当作组装转录本的时候的一个阈值

-p 线程数

比较新的版本才有merge功能,

转录本合并模式使用说明:

stringtie --merge [Options] { gtf_list | strg1.gtf ...}

选项

-G 参考转录本的注释信息 (GTF/GFF3)

-o 合并转录本的GTF输出文件 (default: stdout)

-m 合并转录本的最小长度(default: 50)

-c 合并转录本的最低覆盖度(default: 0)

-F 合并转录本的最小FPKM值(default: 1.0)

-T 合并转录本的最小TPM值(default: 1.0)

-f isoform 最小比例(default: 0.01)

-g 转录本见GAP长度小于阀值则合并两转录本 (default: 250)

-i 允许合并转录本中有内含子保留; by default

-l 输出的转录本名称前缀 (default: MSTRG)

使用方法如下:

需要先将单个样品得到的gtf放到一个mergelist.txt文件里面,然后使用--merge参数即可,也可以设置-m,-c,-F,-T以及-f等参数对组装后的转录本在merge时进行过滤,同时也可以加入-G 参数输入参考的gtf注释文件

stringtie --merge -p 20 -o stringtie_merged.gtf mergelist.txt

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值