Multiobjective Metaheuristic to Design RNA Sequences

今天要写的是《Multiobjective Metaheuristic to Design RNA Sequences》,这是今年(2019)发表在TEVC上的一篇文章。

该文提出了一种设计RNA序列的方法m2dRNAs,采用了三个目标函数:

  1. 分区函数,即整体的自由能(partition function,free energy of the ensemble)
  2. 集成多样性 (ensemble diversity)
  3. 核苷酸成分(nucleotides composition)

约束为目标和预测结构间的相似度

代码下载地址:http://arco.unex.es/arl/m2dRNAs-source_code.zip


  • 什么是RNA inverse folding problem(RNA逆折叠问题) ?

Given a particul RNA secondary structure (target structure), finding a sequence of base pairs that would fold into this structure is known as the RNA inverse folding problem.


  • 几种解决RNA逆折叠的方法
    • RNAinverse
      将目标结构划分成几个更小的结果,并使用自适应随机漫步法最小化目标结构与当前序列中最小自由能(Minimum Free Energy, MFE)的二级结构间的汉明距离。
    • RNA-SSD
      采用分治法逐级分解输入的目标结构;采用贪婪初始化步骤选取初始的RNA序列,并采用了随机局部搜索方法。
    • INFO-RNA
      包含两个基本步骤。动态规划:用来产生好的初始解,且在初始化中只会选择能量低的的序列;改进的随机局部搜索法,基于额外的能量的准则采取了一种前瞻性(look-ahead)的选择步骤。主要得缺点是得到的RNA序列GC含量(鸟嘌呤与胞嘧啶占四种碱基的比例)高,这与生物学上的活RNA不一样。
    • MODENA
      采用NSGA-II解决,共有两个目标:a) 结构稳定性(序列的MFE结构的能量);b) 结构相似性(候选序列和目标结构的MFE结构间的距离)
    • fRNAkenstein
      这个方法是用来解决这个问题的多任务版本,也就是说其目标是同时找到多个目标结构。
    • DSS-Opt
      DSS-Opt在序列空间中使用了牛顿动力学结合非设计项(a negative design 没有看原文不是很理解)和模拟退火来优化序列使起朝着理想的二级结构折叠。采用评分函数有:a) 序列成分的最近邻模型能量(nearest-neighbor model energies for sequence compositions); b) negative design; c) 序列异质性(sequence heterogeneity);d) 成分约束( composition constraint)
    • RNSAiFOLD
      带约束的规划法。提供的目标有:a) MFE;b) 自由能;c)整体缺陷,可由用户自行设选择其中一个目标,并且提供了各种约束。
    • EteRNA Bot
      基于由成千上万的EteRNA players和其他RNA设计软件做出的决策。这是市场上的第一个集成分类器。
    • ERD
      首先重建RNA子序列(池),其对应不同长度的不同成分。它构建了一个与给定目标结构兼容的初始RNA序列。然后利用进化算法提升子序列的质量。
    • antaRNA
      采用蚁群优化算法来设计RNA的结构。除了结构约束,antaRNA还允许用户自行设置GC阈值。

  • 建模
  1. Partition Function ( f 1 f_1 f1)
    f 1 ( x ) = ∑ S ∈ S ′ ( x ) e − Δ G ( S ) R T f_{1}(x)=\sum_{S \in S^{\prime}(x)} e^{\frac{-\Delta G(S)}{R T}} f1(x)=SS(x)eRTΔG(S)
  2. Ensemble Diversity ( f 2 f_2 f2)
    f 2 ( x ) = ∑ ( i , j ) ∈ x p i j ⋅ ( 1 − p i j ) f_{2}(x)=\sum_{(i, j) \in x} p_{i j} \cdot\left(1-p_{i j}\right) f2(x)=(i,j)xpij(1pij)
  3. Necleotides Composition ( f 3 f_3 f3)
    f 3 ( x ) = max ⁡ { % G , % A U , % U G } + max ⁡ { % u A , % u C , % u G , % u U } + max ⁡ { % A , % C , % , σ 0 U } f_{3}(x) = \max \{\% G, \% A U, \% U G\} \newline + \max \{\% uA, \% uC, \% uG, \% uU\} \newline + \max \left\{\% A, \% C, \%, \sigma_{0} U\right\} f3(x)=max{%G,%AU,%UG}+max{%uA,%uC,%uG,%uU}+max{%A,%C,%,σ0U}

PS :有关目标的描述,由于需要一定的背景知识,暂时先不写了。之后可能会补上。

此仅为本人阅读论文时的笔记,若有理解有误的地方还请批评指正。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值