RNA 二级结构预测方法

本文详细介绍了RNA二级结构预测方法,包括比较序列分析、动态规划法(最大碱基配对与最小自由能算法)和组合优化方法(螺旋区堆积算法与最大权重匹配算法)。RNA二级结构预测在生物信息学中具有重要意义,这些方法各有优缺点,其中动态规划法的最小自由能算法结合能量参数预测精度较高,而启发式方法如遗传算法和遗传模拟退火算法能避免局部最优,提供多样化的预测结果。
摘要由CSDN通过智能技术生成

RNA 二级结构预测是指以生物信息学理论为基础,输入 RNA 一级序列,计算预测 RNA 二级结构的过程。RNA 的一级序列主要由 A,G,C,U 四类碱基组成。RNA 二级结构指由非相邻碱基相互作用折叠形成的平面结构。
最近的研究表明,RNA 的二级结构对于调控来说具有非常重要的作用。例如,RNA 的不同结构模式与编码区域、剪接点和多腺苷酸化点相关;动物细胞的活动过程和酵母受 RNA 二级结构的影响明显不同;又如,RNA 二级结构在蓝藻多变鱼腥藻的 nifH1 转录稳定性中发挥了重要作用。同时,有证据表明二级结构可以极大地影响三级结构。所以确定 RNA 二级结构,对分析和理解基因遗传信息的传递机制至关重要。

下面将描述一些传统的 RNA 二级结构预测算法。

1、比较序列分析方法

比较序列分析法也是常用的 RNA 二级结构预测算法之一。其工作原理其实比较简单,它以 RNA 序列中互补碱基间的共变联配(英文名称为 covariant-alignment)活动为基础;以已知的 RNA 序列的数据为依据标准,以查找被测算 RNA 序列中的高近似度序列为手段;以一定的相关数学模型为依托,共同研究推算所给 RNA 序列的二级结构。
比较序列分析适用于多条 RNA 序列的结构预测问题。在生物实验过程中,常常需要同时处理一组或几组同源的 RNA 序列。通常认为序列的保守性要小于结构的保守性。因此即使这些同源 RNA序列的长度、碱基排序不同,结构却十分相似,在生物体内也发挥出相似的功能,例如,tRNA 分子的序列虽不一致,但其二级结构都是三叶草形的,三级结构是倒 L 形。
由于结构的保守性,比较序列的方法有着较高的预测精度。比较序列分析法主要由多序列比对与序列结构预测两个部分组成,根据序列比对和结构预测顺序的不同,比较序列分析的 RNA 二级结构预测算法可以分为如下三类:
在这里插入图片描述
(1)先比对后预测,首先使用多序列比对工具来构造出 RNA 序列比对结果,然后通过检测碱基突变等信息来揭示这些 RNA 序列共有的一致保守结构。然而,使用该类算法会得到多个可能的预测结果,且无法保证其中是否包含真实的二级结构。
(2)先预测后比对,首先对集合中的每个序列分别进行结构预测,然后对这些结果进行比较分析,最后获得这些 RNA 序列的保守二级结构。这种预测算法过于依赖结构比对的结果,同时准确性也无法得到很好的保证。
(3)序列比对与结构预测同时进行,算法利用多序列比对方法和最大碱基配对算法递归的完成序列比对和 RNA 结构预测等操作。由于序列比对与结构预测需要同时进行,其空间复杂度和时间时间复杂度明显增加。因此,这类算法在预测的序列长度不能太长,否则花费的成本太高,序列长度较小时可以尝试使用。

比较序列分析方法是目前测算分子结构准确度最高的方法之一,同时,比较序列分析方法在测算假结结构等问题时也有比较突出的结果,然后目前正在使用的其它方法中有的还仍不能对假结进行测算。但比较序列分析方法也有不足的地方,就是对于较少、甚至是一条序列,以及同源性低的序列不适合使用,测算结果较差。

2、动态规划法

动态规划是一种寻求最优决策的数学方法,其核心思想是将一个多阶段决策问题分解为一组子阶段决策问

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值