SCFGs

Stochastic context-free grammars for tRNA modeling

Year: 1994
Authors: Yasubumi Sakakibara, Michael Brown, Richard Hughey, I.Saira Mian, Kimmen Sjolander, Rebecca C.Underwood and David Haussler
Journal Name: Nucleic Acids Research

Research Objective

通过类似于构建 HMM 的方式 (CYK) 生成包含碱基配对信息的 SCFG 来创建 tRNA 的统计模型

Background

CFG 的 grammer 由以下三部分组成。第一部分是有限的字母表,对于 RNA 序列,字母表对应核苷酸 A , U , G 和 C 。第二部分是有限的非终端节点 S 1 , . . . , S n S_1, ..., S_n S1,...,Sn 和 根节点 S 0 S_0 S0 。第三部分是扩展非终端节点的规则集合 P ,终端节点序列由根节点 S 0 S_0 S0 通过规则 P P P 一步一步生成。
定义 S S S 为非终端节点, a a a 表示终端节点。 P P P 含有以下几种规则。 S → a S a S \rightarrow aSa SaSa 表示碱基对,比如 S → G S C S \rightarrow GSC SGSC 代表 G-C 碱基对。 S → a S S \rightarrow aS SaS S → a S \rightarrow a Sa 表示未配对碱基。 S → S S \rightarrow S SS 表示该位置没有核苷酸。 S → S S S \rightarrow SS SSS 表示二级结构分支。具体如下图所示。
在这里插入图片描述

Method

CFGs 的语法针对于一个序列会产生不同的树。SCFGs 通过改变后的 CYK 算法选择概率最大的树(生成的结构),解决了这个问题(结构预测问题)。
序列 s s s 在一个 SCFG G G G 所产生的所有树的概率之和为 P ( s ∣ G ) P(s|G) P(sG) ,比较不同 SCFGs 所产生的概率即可确定 RNA 所在类别(分类问题)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值