转录组分析流程|TransDecoder预测转录本的开放阅读框(二)

使用TransDecoder预测CDS

TransDecoder按照其官网的说明,主要用于识别转录本序列中的潜在的编码区域,也就是预测CDS。转录本可以由RNA-Seq数据通过Trinity组装来的,也可以由RNA-Seq比对到参考基因组上构建的转录本。
最新版本的TransDecoder可在此处找到。

TransDecoder识别可能的编码区域是基于以下几个标准:

  1. 在转录本序列中发现一个最小长度的开放阅读框(ORF)

  2. 类似于GeneID软件计算的对数似然分数>0

  3. 当ORF在第一个阅读框中得分时,与其他5个阅读框中的得分相比,上述编码得分最高

  4. 如果发现一个候选ORF被另一个候选ORF的坐标完全封装,则报告较长的ORF。然而,一个转录本可以报告多个ORF(允许操纵子、嵌合体等)

  5. 建立/训练/使用PSSM来完善起始密码子预测。

  6. 可选:假定肽与噪声截止分数以上的Pfam结构域匹配

Step 1: 提取长开放阅读框

TransDecoder.LongOrfs -t target_transcripts.fasta

默认情况下,TransDecoder.LongOrfs将识别至少100个氨基酸长的ORF。您可以通过’-m’参数降低

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值