TransDecoder
TransDecoder识别转录本序列中的候选编码区,例如使用 Trinity 从头 RNA-Seq 转录本组装生成的编码区,或使用 Tophat 和 Cufflinks 基于与基因组的 RNA-Seq 比对构建的编码区。
TransDecoder 基于以下标准识别可能的编码序列:
1.在转录本序列中需要能够找到一个(满足)最小(限定)长度的ORF;
2.对数似然数得分大于0。(与GeneID软件计算得到的得分相类似);
3.第一阅读框的对数似然数打分同其它5个阅读框比较为最大值时;
4.如果候选的ORF完全被包含在其它候选ORF的框架内,那么报告最长的ORF。否则,一个单独的转录本会得到多个ORF的报告。(考虑到有操纵子、嵌合体等情况);
5.作为可选项,预测出的多肽在Pfam domain库中存在比对分值高于得分阈值之上的。
6.该软件主要由Broad Institute的Brian Haas和Commonwealth Scientific and Industrial Research Organisation的Alexie Papanicolaou维护。它被整合在其它相关的软件中:Trinity,PASA,EVidenceModeler和Trinotate。
TransDecoder相关使用方法来啦!!!
一、软件安装
直接从https://github.com/TransDecoder/TransDecoder/releases下载最新版的TransDecoder
二、软件使用
TransDecoder通过运行一个包含目的转录本序列的fasta文件来实现功能。简单的用法如下:
#S