SCFGs

最新推荐文章于 2024-07-25 16:05:31 发布

吊儿郎当的凡

最新推荐文章于 2024-07-25 16:05:31 发布

阅读量368

点赞数

分类专栏： RNA结构预测文章标签：生物信息学机器学习数据挖掘模式识别

本文链接：https://blog.csdn.net/weixin_43269419/article/details/121224692

版权

RNA结构预测专栏收录该内容

13 篇文章 4 订阅

订阅专栏

Stochastic context-free grammars for tRNA modeling

Year: 1994
Authors: Yasubumi Sakakibara, Michael Brown, Richard Hughey, I.Saira Mian, Kimmen Sjolander, Rebecca C.Underwood and David Haussler
Journal Name: Nucleic Acids Research

Research Objective

通过类似于构建 HMM 的方式 (CYK) 生成包含碱基配对信息的 SCFG 来创建 tRNA 的统计模型

Background

CFG 的 grammer 由以下三部分组成。第一部分是有限的字母表，对于 RNA 序列，字母表对应核苷酸 A ， U ， G 和 C 。第二部分是有限的非终端节点 $S_1, ..., S_n$ 和根节点 $S_0$ 。第三部分是扩展非终端节点的规则集合 P ，终端节点序列由根节点 $S_0$ 通过规则 $P$ 一步一步生成。
定义 $S$ 为非终端节点， $a$ 表示终端节点。 $P$ 含有以下几种规则。 $\rightarrow aSa$ 表示碱基对，比如 $\rightarrow GSC$ 代表 G-C 碱基对。 $\rightarrow aS$ 和 $\rightarrow a$ 表示未配对碱基。 $\rightarrow S$ 表示该位置没有核苷酸。 $\rightarrow SS$ 表示二级结构分支。具体如下图所示。
在这里插入图片描述

Method

CFGs 的语法针对于一个序列会产生不同的树。SCFGs 通过改变后的 CYK 算法选择概率最大的树（生成的结构），解决了这个问题（结构预测问题）。
序列 $s$ 在一个 SCFG $G$ 所产生的所有树的概率之和为 $P (s ∣ G)$ ，比较不同 SCFGs 所产生的概率即可确定 RNA 所在类别（分类问题）。

吊儿郎当的凡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SCFGs

Stochastic context-free grammars for tRNA modelingYear: 1994Authors: Yasubumi Sakakibara, Michael Brown, Richard Hughey, I.Saira Mian, Kimmen Sjolander, Rebecca C.Underwood and David HausslerJournal Name: Nucleic Acids ResearchResearch Objective通过类似于构
复制链接

扫一扫

专栏目录