【机器学习】隐马尔可夫(二)----概率计算问题

最新推荐文章于 2024-02-05 10:42:54 发布

htshinichi

最新推荐文章于 2024-02-05 10:42:54 发布

阅读量1.3k

点赞数

分类专栏：学习笔记文章标签：机器学马尔可统

本文链接：https://blog.csdn.net/u013597931/article/details/80593210

版权

学习笔记专栏收录该内容

27 篇文章 2 订阅

订阅专栏

前一篇说到隐马尔可夫有三个基本问题，其中概率计算问题是首当其冲需解决的问题。
概率计算问题就是在给定模型 $λ=(A,B,π)$ 和观测序列 $O=(o_1,o_2,...,o_T)$ ，计算观测序列 $O$ 出现的概率 $P(O|λ)$

乘法公式的推广

在做隐马尔可夫公式推导前，我们需要复习一下概率乘法公式的推广。
若 $P(A_1A_2...A_{n-1})>0,n\ge2$
则 $P(A_1A_2...A_n)$
$=P(A_n|A_1A_2...A_{n-1})...P(A_3|A_1A_2)P(A_2|A_1)P(A_1)$
可以写成 $P(A_2...A_n|A_1)$
$=P(A_n|A_1A_2...A_{n-1})...P(A_3|A_1A_2)P(A_2|A_1)$
$\color{red}{换到此问题中来，我们可以将λ和O同时出现的联合概率写为}$
$\color{red}{P(O,I|λ)=P(O|I,λ)P(I|λ)}$

直接计算

直接计算是最简单粗暴的方法，即列举长度为 $T$ 的状态序列 $I$ 的所有可能序列，对每一个可能的状态序列 $I_x$ 求其与观测序列 $O$ 的联合概率 $P(O,I_x|λ)$ ，然后对其求和得 $\sum\limits_{x}P(O,I_x|λ)=P(O|λ)$ 。

①列举所有可能的状态序列 $I_x=(i_1,i_2,...,i_T)$

状态序列长度为 $T$ ，即 $t=1,2,...,T$ 。每个时刻状态 $i_t$ 有 $N$ 种可取状态，因此所有可能的状态序列数为 $N^T$

②计算 $O$ 和每种状态序列 $I_x$ 同时出现的联合概率 $P(O,I_x|λ)$

$P(O,I_x|λ)=P(O|I_x,λ)P(I_x|λ)$
可以看做分为三步：
第一步：求给定模型 $λ$ 条件下出现状态序列 $I_x$ 的概率
由要求可知，我们需要用到初始状态概率 $π$ 和状态转移概率矩阵 $A$
$P(I_x|λ)=π_{i_1}a_{i_1i_2}a_{i_2i_3}...a_{i_{T-1}i_T}$

第二步：对给定的状态序列 $I_x$ 和模型 $λ$ 的条件下观测序列 $O$ 的概率
由要求可知，我们需要用到初始状态概率 $π$ 和观测概率矩阵 $B$
$P(O|I_x,λ)=b_{i_1}(o_1)b_{i_2}(o_2)...b_{i_T}(o_T)$

第三步：将前两步得到的相乘
$P(O,I_x|λ)=P(O|I_x,λ)P(I_x|λ)$
$=π_{i_1}b_{i_1}(o_1)a_{i_1i_2}b_{i_2}(o_2)...a_{i_{T-1}i_T}b_{i_T}(o_T)$
有 $2T$ 项相乘

③对所有可能的状态序列 $I_x$ 求和，得到 $P(O|λ)$

$P(O|λ)=\sum\limits_{x}^{N^T}P(O,I_x|λ)$
计算量为 $O(2T·N^T )=O(TN^T)$ ，计算量呈指数级，因此用这种直接计算的方法很困难。

前向-后向算法

利用前向算法和后向算法都可以得到观测序列概率 $P(O|λ)$

$\color{blue}{a_{jk}和b_k(o_{t+1})}$

回忆一下状态转移概率 $a_{jk}$ 和观测概率 $b_k(o_{t+1})$ ，它们会在前向算法和后向算法中用到
$a_{jk}=P(i_{t+1}=q_k|i_t=q_j)$
$b_k(o_{t+1})=P(o_{t+1}|i_{t+1}=q_k)$

$\color{blue}{前向算法}$

前向概率定义

给定隐马尔可夫模型 $λ$ ，定义到时刻 $t$ 部分观测序列为 $o_1,o_2,...,o_t$ 且状态为 $q_j$ 的概率为前向概率，记作 $α_t(j)=P(o_1,o_2,...,o_t,i_t=q_j|λ)$

第一步：根据这些概率我们可以找到 $α_{t+1}(k)$ 与 $α_t(j)$ 的关系
① $α_t(j)·a_{jk}=P(o_1,o_2,...,o_t,i_t=q_j|λ)·P(i_{t+1}=q_k|i_t=q_j)$
$=P(o_1,o_2,...,o_t,i_t=q_j,i_{t+1}=q_k|λ)$
② $\sum\limits_{j=1}^Nα_t(j)·a_{jk}=\sum\limits_{j=1}^NP(o_1,o_2,...,o_t,i_t=q_j,i_{t+1}=q_k|λ)$
$=P(o_1,o_2,...,o_t,i_{t+1}=q_k|λ)$
③ $[\sum\limits_{j=1}^Nα_t(j)·a_{jk}]·b_k(o_{t+1})$
$=P(o_1,o_2,...,o_t,i_{t+1}=q_k|λ)·P(o_{t+1}|i_{t+1}=q_k)$
$=P(o_1,o_2,...,o_t,o_{t+1},i_{t+1}=q_k|λ)=α_{t+1}(k)$
计算量为 $N$
第二步：获取初值 $α_1(j)$ 并递推至 $α_T(j)$
初值： $α_1(j)=π_jb_j(o_1)=P(i_1=q_j|λ)·P(o_1|i_1=q_j)$
递推：对于 $t=1,2,...,T-1$
$α_{t+1}(k)=[\sum\limits_{j=1}^Nα_t(j)·a_{jk}]·b_k(o_{t+1})$
计算量为 $1+T-1=T$
第三步：求 $P(O|λ)$
$P(O|λ)=\sum\limits_{k=1}^Nα_T(k)=\sum\limits_{k=1}^NP(o_1,o_2,...,o_T,i_T=q_k|λ)$
$=P(o_1,o_2,...,o_T|λ)=P(O|λ)$
计算量为 $N$

总的计算量为 $O(N·T·N)=O(N^2T)$

$\color{blue}{后向算法}$

与前向算法类似

后向概率定义

给定隐马尔可夫模型 $λ$ ，定义在时刻 $t$ 状态为 $q_j$ 的条件下，从 $t+1$ 到 $T$ 的部分观测序列为 $o_{t+1},o_{t+2},...,o_T$ 的概率为后向概率，记作 $β_t(j)=P(o_{t+1},o_{t+2},...,o_T|i_t=q_j,λ)$

第一步：根据这些概率我们可以找到 $β_t(j)$ 与 $β_{t+1}(k)$ 的关系
① $β_{t+1}(k)·b_k(o_{t+1})·a_{jk}$
$=P(o_{t+2},o_{t+3},...,o_T|i_{t+1}=q_k,λ)·P(o_{t+1}|i_{t+1}=q_k)·P(i_{t+1}=q_k|i_t=q_j)$
$=P(o_{t+1},o_{t+2},o_{t+3},...,o_T,i_{t+1}=q_k|i_t=q_j,λ)$
② $\sum\limits_{k=1}^Nβ_{t+1}(k)·b_k(o_{t+1})·a_{jk}$
$=\sum\limits_{k=1}^NP(o_{t+1},o_{t+2},o_{t+3},...,o_T,i_{t+1}=q_k|i_t=q_j,λ)$
$=P(o_{t+1},o_{t+2},o_{t+3},...,o_T|i_t=q_j,λ)$
$=β_t(j)$
计算量为 $N$
第二步：获取初值 $β_T(j)$ 并递推至 $β_1(j)$
初值： $β_T(j)=1$
递推：对于 $t=T-1,T-2,...,1$
$β_t(j)=\sum\limits_{k=1}^Nβ_{t+1}(k)·b_k(o_{t+1})·a_{jk}$
计算量为 $1+T-1=T$
第三步：求 $P(O|λ)$
$P(O|λ)=\sum\limits_{j=1}^Nβ_1(j)·b_j(o_{t+1})·π_j$
$=\sum\limits_{j=1}^NP(o_2,o_3,...,o_T|i_1=q_j,λ)·P(o_1|i_1=q_j)·P(i_1=q_j|λ)$
$=\sum\limits_{j=1}^NP(o_1,o_2,o_3,...,o_T,i_1=q_j|λ)$
$=P(o_1,o_2,o_3,...,o_T|λ)=P(O|λ)$
计算量为 $N$

总的计算量为 $O(N·T·N)=O(N^2T)$

$\color{red}{利用前向概率和后向概率的定义，可以将观测序列概率P(O|λ)写成}$
$\color{red}{P(O|λ)=\sum\limits_{j=1}^N\sum\limits_{k=1}^Nα_t(j)a_{jk}b_k(o_{t+1})β_{t+1}(k)}$
$\color{red}{t=1,2,...,T-1}$

$\color{blue}{通过前向、后向概率求状态概率和期望}$

状态概率

单个状态：
给定模型 $λ$ 和观测序列 $O$ ，在 $t$ 时刻处于状态 $q_j$ 的概率记为：
　　　　　　　　 $γ_t(j)=P(i_t=q_j|O,λ)$
　　　　　　　　
找出其和前向概率 $α_t(j)$ 和后向概率 $β_t(j)$ 的关系：
$γ_t(j)=P(i_t=q_j|O,λ)=\frac{P(i_t=q_j,O|λ)}{P(O|λ)}=\frac{α_t(j)β_t(j)}{\sum\limits_{k=1}^Nα_t(k)β_t(k)}$

两个状态同时：
给定模型 $λ$ 和观测序列 $O$ ，在 $t$ 时刻处于状态 $q_j$ 且在 $t+1$ 时刻处于状态 $q_k$ 的概率记为： $ξ_t(j,k)=P(i_t=q_j,i_{t+1}=q_k|O,λ)$

找出其和前向概率 $α_t(j)$ 和后向概率 $β_t(j)$ 的关系：
$ξ_t(j,k)=\frac{P(i_t=q_j,i_{t+1}=q_k,O|λ)}{P(O|λ)}=\frac{α_t(j)a_{jk}b_k(o_{t+1})β_{t+1}(k)}{\sum\limits_{j=1}^N\sum\limits_{k=1}^Nα_t(j)a_{jk}b_k(o_{t+1})β_{t+1}(k)}$

期望

(1)在观测序列 $O$ 下状态 $j$ 出现的期望值为 $\sum\limits_{t=1}^Tγ_t(j)$
(2)在观测序列 $O$ 下由状态 $j$ 转移的期望值为 $\sum\limits_{t=1}^{T-1}γ_t(j)$
(3)在观测序列 $O$ 下由状态 $j$ 转移到状态 $k$ 的期望值为 $\sum\limits_{t=1}^{T-1}ξ_t(j,k)$

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

htshinichi

关注关注

0
点赞

踩

1

收藏

觉得还不错? 一键收藏

0
评论

复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python-输入输出隐马尔可夫模型IOHMM的Python包

08-11

- 可能支持Scikit-learn的接口，方便在机器学习流水线中使用。在实际项目中，了解并熟练运用这些知识点可以帮助开发者利用IOHMM解决各种序列数据分析问题。这个"Mogeng-IOHMM-9578803"包提供了在Python环境中实现...

【Pytorch】第 2 章：马尔可夫决策过程和动态规划

sikh_0529的博客

12-07 2989

在本章中，我们将通过查看马尔可夫决策过程( MDP ) 和动态规划，继续我们使用 PyTorch 的实际强化学习之旅。本章将从创建马尔可夫链和 MDP 开始，这是大多数强化学习算法的核心。通过实践政策评估，您还将更加熟悉贝尔曼方程。然后，我们将继续并应用两种方法来解决 MDP：价值迭代和策略迭代。我们将使用 FrozenLake 环境作为示例。在本章的最后，我们将逐步演示如何用动态规划解决有趣的抛硬币赌博问题。本章将介绍以下食谱：您需要在系统上安装以下程序才能成功执行本章中的食谱：让我们从创建马尔可夫链开始

参与评论您还未登录，请先登录后发表或查看评论

【应用随机过程】02. 马尔可夫链及其概率分布

05-08 6302

本文主要介绍马尔可夫链的定义，通过转移概率和转移概率矩阵来研究马尔可夫链的有限维分布。

一文讲透：HMM隐马尔科夫模型

StarrySky3的博客

12-23 1642

一、马尔科夫模型 1 马尔科夫的几个概念要想理解隐马尔科夫模型，首先要理解马尔科夫模型。下面通过一个天气变化的例子来认识马尔科夫模型中的几个重要概念。 ????????????：现在天气有三种状态：晴天，多云，雷雨。那么，有以下三组问题： 1）今天晴天明天是晴天的概率是多少？今天晴天明天多云的概率是多少？今天晴天明天雷雨的概率是多少？ 2）今天多云明天是晴天的概率是多少？今天多云明天多云的概率是多少？今天多云明天是雷雨的概率是多少？ 3）今天雷雨明天是晴天的概率是多少？今天雷雨明天多云的概率是多少？

隐马尔可夫模型学习笔记（之一，概率计算问题）

Li Kang 笔记本

06-15 2647

隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。隐马尔可夫链随机生成的状态的序列，称为状态序列（state sequence);每个状态生成一个观测，而由此产生的观测的随机序列，称为观测序列（observation sequence)。序列的每一个位置又可以看作是一个时刻。

《统计学习方法》——隐马尔可夫模型#习题解答#

日积月累，天道酬勤

05-20 1053

统计学习方法HMM 隐马尔可夫模型习题解答

Python-与贝叶斯机器学习方法相关的Notebooks

08-11

首先，贝叶斯机器学习基于概率论中的贝叶斯定理，它是一种处理不确定性问题的有效方法。贝叶斯定理描述了在已知先验概率的情况下，如何更新我们的信念以得到后验概率。在机器学习中，我们通常用这种方法来估计模型...

Python-hmmlearn是一组用于无监督学习和隐马尔可夫模型推理的算法

08-11

在Python的机器学习领域，`hmmlearn`库是一个重要的工具，它专注于无监督学习以及隐马尔可夫模型（Hidden Markov Models, HMMs）的推理和训练。这个库为开发者提供了一套完整的接口，可以方便地处理基于HMM的序列...

机器学习-CS572-F22-A2-SequenceLabeling

06-25

《机器学习-C572-F22-A2-SequenceLabeling》在计算机科学与人工智能领域，机器学习是一项核心技术，其目标是使计算机系统能够从数据中自动学习规律，进而进行预测或决策。本项目“CS572-F22-A2-SequenceLabeling”...

机器学习与模式识别-教学大纲.docx

06-16

此外，还需了解机器学习的一些通用理论框架，如假设空间、采样理论、计算学习理论等，同时也需对无监督学习和强化学习有一定的了解。 2. **模式识别基础**：模式识别部分则侧重于教授学生关于计算机模式识别的基本...

HMM 隐马尔科夫概率图

11-02

见过的讲解ＨＭＭ最清楚明白的ＰＰＴ，有图有例子

全概率公式: 解决高斯隐马尔可夫模型的神奇之处

程序员光剑

01-16 93

高斯隐马尔可夫模型是一种基于概率论和统计学的数学模型，它的核心思想是将一个随机过程分解为一系列相互独立的、不可观测的隐藏状态，这些状态之间的关系通过观测到的随机过程来描述。这种模型在处理随机过程和时间序列数据时具有很强的优势，因为它可以捕捉到随机过程的时间依赖性和状态转移的概率分布。在实际应用中，GHMM被广泛用于语音识别、图像处理、金融时间序列分析等领域。例如，在语音识别中，GHMM可以用来描述不同音素之间的转移概率和发音的观测概率，从而实现自动识别；

概率图模型之马尔可夫随机场

weixin_43797015的博客

12-04 3799

介绍了马尔可夫随机场以及势函数，推导了全局马尔科夫性、局部马尔可夫性和成对马尔可夫性。

概率图模型（马尔可夫模型）

qq_32172681的博客

08-25 7544

一、马尔可夫过程 1、马尔可夫过程 一个马尔科夫过程就是指过程中的每个状态的转移只依赖于之前的n个状态，这个过程被称为1个n阶的模型，其中n是影响转移状态的数目。最简单的马尔科夫过程就是一阶过程，每一个状态的转移只依赖于其之前的那一个状态。 2、马尔可夫链 马尔可夫链是随机变量X1,X2,X3…的一个数列。这些变量的范围，即他们所有可能取值的集合，被称为状态空间。设表示随机...

【算法学习】隐马尔可夫模型HMM（例题+代码）

weixin_43316345的博客

11-30 8540

隐马尔可夫模型HMM,介绍了模型的基本知识，和三个基本问题。其中对概率计算问题和预测（解码）问题进行了详细分析，并提供了python代码实现

机器学习---概率图模型（隐马尔可夫模型、马尔可夫随机场、条件随机场）

最新发布

weixin_43961909的博客

02-05 2273

概率模型直接利用概率求和规则消去变量R的时间和空间复杂度为指数级别𝑂(2^(𝑌 +|𝑅|))，需要一。机器学习最重要的任务是根据已观察到的证据（例如训练样本）对感兴趣的未知变量（例如类别标。计算变量的概率分布，在概率模型中，利用已知的变量推测未知变量的分布称为“推断。生成式：计算联合分布𝑃(𝑌, 𝑅, 𝑂)，判别式：计算条件分布𝑃(𝑌, 𝑅|𝑂)（inference）”，其核心在于基于可观测的变量推测出未知变量的条件分布。符号约定：𝑌为关心的变量的集合，O为可观测变量集合，R为其他变量集合。

HMM隐马尔科夫模型例题讲解加深印象

Mr番茄蛋的博客

10-31 4730

1.题目背景：有一个小城，这里的天气只有晴天和阴天，有一个小女孩平时经常做的就是三件事：散步、购物、打扫。她有一个在外地的男朋友，想知道她的城市里最近三天天气如何，但是女孩只告诉他，第一天她去购物，第二天打扫，第三天在散步。现在男生用这现有的信息要推断出小女孩城市里这三天天气最可能的状态。 2.已知情况：隐含的天气状态 = { 晴 , 阴 } 可观察的感觉状态 = { 购物

概率图模型之马尔科夫模型浅析

shanlepu6038的博客

12-27 2146

注：由于在CSDN中画图和输入公式非常麻烦，所以我选择了手写后拍照截图来表示，可能稍有模糊，请各位看官多担待。下面开始正文叙述：马尔科夫随机场（Markov Random Field，MRF）是典型的马尔科夫网，这是一种著名的无向图模型。图中每个节点表示一个或一组变量，节点之间的边表示两个变量之间的依赖关系。马尔科夫随机场有一组势函数，也成为“因子”，这是定义在变量子集上的非负实数函数，主要用...

隐马尔可夫模型-三个盒子颜色序列概率计算问题

qq_41720020的博客

11-14 2544

HMM案例假设有3个盒子，每个盒子里都装有红、白两种颜色的球。按照下面的方法抽球，产生一个球的颜色的观测序列:开始，以概率T随机选取1个盒子，从这个盒子里以概率B随机抽出1个球，记录其颜色后，放回;然后，从当前盒子以概率A随机转移到下一个盒子，再从这个盒子里以概率B随机抽出一个球，记录其颜色，放回;如此重复进行3次，得到一个球的颜色观测序列: o=(红，白，红）。请计算生成该序列的概率P(O]{A,B, T})。提示:假设状态集合是{盒子1，盒子2，盒子3}，观测的集合是{红，白}，本题中r太杜移概斑分布