转录组分析流程｜TransDecoder预测转录本的开放阅读框（二）

最新推荐文章于 2025-02-13 20:14:39 发布

生信技术

最新推荐文章于 2025-02-13 20:14:39 发布

阅读量7.8k

点赞数 3

文章标签：数据库 python java 机器学习大数据

本文链接：https://blog.csdn.net/m0_49960764/article/details/117357870

版权

使用TransDecoder预测CDS

TransDecoder按照其官网的说明，主要用于识别转录本序列中的潜在的编码区域，也就是预测CDS。转录本可以由RNA-Seq数据通过Trinity组装来的，也可以由RNA-Seq比对到参考基因组上构建的转录本。
最新版本的TransDecoder可在此处找到。

TransDecoder识别可能的编码区域是基于以下几个标准：

在转录本序列中发现一个最小长度的开放阅读框（ORF）
类似于GeneID软件计算的对数似然分数>0
当ORF在第一个阅读框中得分时，与其他5个阅读框中的得分相比，上述编码得分最高
如果发现一个候选ORF被另一个候选ORF的坐标完全封装，则报告较长的ORF。然而，一个转录本可以报告多个ORF（允许操纵子、嵌合体等）
建立/训练/使用PSSM来完善起始密码子预测。
可选：假定肽与噪声截止分数以上的Pfam结构域匹配

Step 1: 提取长开放阅读框

TransDecoder.LongOrfs -t target_transcripts.fasta

默认情况下，TransDecoder.LongOrfs将识别至少100个氨基酸长的ORF。您可以通过’-m’参数降低

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

生信技术

关注关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

TransDecoder

weifanbio的博客

12-27

1954

TransDecoder TransDecoder识别转录本序列中的候选编码区，例如使用 Trinity 从头 RNA-Seq 转录本组装生成的编码区，或使用 Tophat 和 Cufflinks 基于与基因组的 RNA-Seq 比对构建的编码区。 TransDecoder 基于以下标准识别可能的编码序列： 1.在转录本序列中需要能够找到一个（满足）最小（限定）长度的ORF; 2.对数似然数得分大于0。（与GeneID软件计算得到的得分相类似）; 3.第一阅读框的对数似然数打分同其它5个阅读框比较为最大值时

基因组GTF优化全流程

XMQ_MOLLY的博客

04-18

897

基因组注释文件优化及简单验证流程

3 条评论您还未登录，请先登录后发表或查看评论

11.windows ubuntu 子系统 contig ORF（开放阅读框）预测。

weixin_69558614的博客

03-31

1243

Prodigal（PROkaryotic DYnamic programming Gene-finding ALgorithm）是一款用于原核生物基因预测的软件，由美国橡树岭国家实验室和田纳西大学的Doug Hyatt团队于2010年正式发表，2012年增发MetaProdigal专用于宏基因组数据，是目前应用最广泛的基因预测软件之一。前面我们组装了contig，接下来我们要对contig进行 ORF（开放阅读框）预测，这是是一个重要的过程，其目的是识别和预测可能编码蛋白质的区域。接下来我会继续分享。

转录组分析流程

最新发布

ALPH_的博客

02-13

1074

转录组分析流程

DNA sequence open reading frames (ORFs) | DNA序列的开放阅读框ORF预测

weixin_34160277的博客

03-25

3530

常见的ORF预测工具 Open Reading Frame Finder - NCBI ORF Finder - SMS OrfPredictor - YSU 基本概念开放阅读框（英语：Open reading frame；缩写：ORF；其他译名：开放阅读框架、开放读架等）是指在给定的阅读框架中，不包含终止密码子的一串序列。这段序列是生物个体的基因组中，可能作为蛋白质编码序列的部分。...

TransDecoder：转录本基因预测（真菌）

m0_53945548的博客

07-09

420

Swissprot数据库下载可见。pfam-A数据库下载可见。

TransDecoder识别转录本中编码区并预测蛋白

sax_157001的博客

04-06

9184

TransDecoder可以识别转录本序列中的编码区域，如：Trinity从头组装、Tophat和Cufflinks将RNA-Seq比对到基因组转录本结果 TransDecoder 基于以下标准识别可能的编码序列： 1) 在转录本序列中需要能够找到一个（满足）最小（限定）长度的ORF; 2) 对数似然数得分大于0。（与GeneID软件计算得到的得分相类似）; 3...

TransDecoder安装与使用-TransDecoder-v5.7.1（bioinfomatics tools-008）

weixin_44874487的博客

03-07

4817

TransDecoder 去冗余三部曲，这里是和配合trinity使用，可以得到真实的Unigene，为下游PCR或qPCR验证做下铺垫。

TransDecoder:TransDecoder源

05-08

- **ORF预测**：TransDecoder可以自动识别并预测基因组或转录组中的ORFs，包括那些可能存在于不常见的起始密码子或内部起始位点的ORFs。 - **蛋白结构预测**：利用HHpred等工具进行远程同源性搜索，预测新发现的...

提升孤儿基因预测准确性：优化MIND和BIND工作流程

MIND.loci.gff3文件是一个GFF3格式的文件，它包含了预测得到的基因区域位置信息，GFF3是一种通用的文本文件格式，用来记录基因组特征，比如基因、转录本和外显子的位置和属性。 4. BIND.loci.gff3预测文件： BIND...

gitblog_00024的博客

05-27

475

使用TransDecoder寻找转录本中的编码区

xuzhougeng blog

08-28

4471

TransDecoder能够从转录本序列中鉴定候选编码区。这些转录本序列可以来自于Trinity的从头组装，或者来自于Cufflinks或者StringTie的组装结果。软件安装从https://github.com/TransDecoder/TransDecoder/releases下载最新版的TransDecoder，以v5.5.0为例 mkdir -p ~/opt/bio...

TransDecoder 项目使用教程

gitblog_00424的博客

10-11

978

TransDecoder 项目使用教程 TransDecoder TransDecoder source 项目地址: https://gitcode.com/gh_mirrors/tr/TransDecoder ...

探秘基因中的隐藏信息：TransDecoder项目深度解析

gitblog_00436的博客

10-10

744

探秘基因中的隐藏信息：TransDecoder项目深度解析项目地址:https://gitcode.com/gh_mirrors/tr/TransDecoder 项目介绍在生命科学的浩瀚领域中，解码基因的秘密是一场永无止境的探索。TransDecoder 正是这场探索中的得力工具，它专为从转录组数据中识别潜在编码蛋白质的序列而生。TransDecoder利用已存在的转录本预测编码区，帮助研究...

TransDecoder 项目常见问题解决方案

gitblog_00499的博客

11-13

779

TransDecoder 项目常见问题解决方案 TransDecoder TransDecoder source 项目地址: https://gitcode.com/gh_mirrors/tr/TransDecoder ...

如何对基因组序列进行注释

weixin_33770878的博客

09-06

8913

基因组组装完成后，或者是完成了草图，就不可避免遇到一个问题，需要对基因组序列进行注释。注释之前首先得构建基因模型，有三种策略：从头注释(de novo prediction)：通过已有的概率模型来预测基因结构，在预测剪切位点和UTR区准确性较低同源预测(homology-based prediction...

TransDecoder 项目推荐

gitblog_00393的博客

11-14

307

转录组分析_转录组

weixin_39709674的博客

12-20

1623

技术简介转录组是某个物种或特定细脃类型产生的所有转录本的集合。转录组研究能够从整体的水平研究基因的功能以及基因的结构，揭示特定生物学过程以及疾病发生过程中的分子机理，已广泛应用于基础研究、临床诊断和药物研发等領域。基于Illumina高通量測序平台的转彔组测序技术，能够在单核苷酸水平对任意物种的整体转录活动进行检测，在分析转录本的结构和表达水平的同时，还能发现未知转录本和稀有转录本，精确地识别可变...

基因组注释（Annotation）

hgz2020的博客

09-23

4035

Annotation