浅尝马尔科夫模型

本文介绍了马尔科夫模型在离散情况下的统计决策方法,特别是在DNA序列分析中的应用。通过对CpG岛序列的统计,确定状态转移矩阵,用于判断DNA序列是否来自CpG岛。此外,文章还提及了隐马尔可夫模型(HMM)的概念及其在序列分析中的应用。
摘要由CSDN通过智能技术生成

马尔科夫模型(Markov Model)又是一个我之前经常听到但从未弄明白的模型。下面我们试着来增进对它的理解。
本文将讨论在离散情况下使用马尔科夫模型的统计决策方法。
贝叶斯决策的基本思想是根据一定的概率模型得到样本属于某类的后验概率,然后根据后验概率的大小进行决策。
问题描述:基因组上CpG相对富集的区域被称作CpG岛,接下来我们要从给定的一定DNA序列,判断它是否来自CpG岛,这属于一个两分类问题。
DNA序列每个位置上的核苷酸都可以被当作一个有四种可能取值的离散随机变量 x = { A , T , G , C } x=\{A, T, G, C\} x={ A,T,G,C}
在上述问题中我们要考虑连续位置上出现的CpG双核苷酸,可以用马尔科夫模型来表示这种相邻位置之间的依赖关系。如果第 i i i时刻上的取值依赖于且仅依赖于第 i − 1 i-1 i1时刻的取值,即 P ( x i ∣ x i − 1 , x i − 2 , . . . , x 1 ) = P ( x i ∣ x i − 1 ) P(x_i|x_{i-1},x_{i-2},...,x_1)=P(x_i|x_{i-1}) P(xixi1,xi2,...,x1)=P(xixi1),则把这个串称作一个一阶马尔科夫链(模型)。
马尔可夫链可以用条件概率模型来描述。我们把在前一时刻某取值下当前时刻取值的条件概率称作转移概率(Transition Probability),记为 a s t = P ( x i = t ∣ x i − 1 = s ) a_{st}=P(x_i=t|x_{i-1}=s) ast=P(xi=tx

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值