HMM隐马尔科夫模型

最新推荐文章于 2023-09-11 14:29:04 发布

煎饼证

最新推荐文章于 2023-09-11 14:29:04 发布

阅读量411

点赞数

分类专栏：机器学习文章标签： HMM

本文链接：https://blog.csdn.net/jianbinzheng/article/details/82745221

版权

机器学习专栏收录该内容

32 篇文章 0 订阅

订阅专栏

对HMM做概述，主要摘抄自《统计学习方法》，概率计算为主，对学习和预测算法暂时忽略。
最后补充一些HMM在地图匹配上的应用

1.HMM

定义和理解

隐马尔可夫模型(Hidden Markov Model)，标注问题，生成模型。

定义：隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。

变量：
1. 状态集合： $Q=\{q_1,q_2,...,q_N\}$
2. 观测集合： $V=\{v_1,v_2,...,v_M\}$
3. 状态序列： $I=(i_1,i_2,...,i_T)$
4. 观测序列： $O=(o_1,o_2,...,o_T)$
5. 状态转移概率矩阵：表示时刻 $t$ 时状态 $q_i$ 且时刻 $t+1$ 时状态 $q_j$ 的概率

A = [a i j] N \times N a i j = P (i t + 1 = q j | i t = q i)

$A=[a_{ij}]_{N\times N}\\a_{ij}=P(i_{t+1}=q_j|i_t=q_i)$
6. 观测概率矩阵：表示时刻

t t $t$ 处于状态

q_{j}

$q_j$ 的条件下生成观测

vk v k $v_k$ 的概率

B = [b j (k)] N \times M b j (k) = P (o t = v k | i t = q j)

$B=[b_j(k)]_{N\times M}\\b_j(k)=P(o_t=v_k|i_t=q_j)$
7. 初始状态概率向量：表示t=1时处于状态

qi q i $q_i$ 的概率

π i = P (i 1 = q i)

$\pi_i=P(i_1=q_i)$

隐马尔可夫模型由初始状态概率向量 $\pi$ 、状态转移概率矩阵 $A$ 、观测概率矩阵 $B$ 决定
$\pi$ 和 $A$ 确定了隐藏的马尔可夫链，生成不可观测的状态序列； $B$ 决定了从状态序列生成观测序列
则模型表示为

λ = (A, B, π)

$\lambda=(A,B,\pi)$

两个基本假设：
1. 齐次马尔可夫性假设。即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于其前一时刻的状态，与其他时刻的状态和观测无关，也与时刻t无关

$P (i t | i t - 1, o t - 1, . . ., i 1, o 1) = P (i t | i t - 1)$ $P(i_t|i_{t-1},o_{t-1},...,i_1,o_1)=P(i_t|i_{t-1})$
2. 观测独立性假设。即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测及状态无关
$P (o t | i T, o T, . . ., i 1, o 1) = P (o t | i t)$ $P(o_t|i_T,o_T,...,i_1,o_1)=P(o_t|i_t)$

举个例子：从ABCD四个盒子拿球，每个盒子装有RW两色的球，已知取了5次得到的颜色，那么
状态集合：{A,B,C,D}
观测集合：{R,W}
观测序列：{R,R,W,W,R}
状态序列：隐含状态，一般是求解目标

观测序列生成过程

输入：HMM模型 $\lambda=(A,B,\pi)$ ，观测序列长度 $T$
输出：观测序列 $O=(o_1,o_2,...,o_T)$
步骤：
1. 按照初始状态分布 $\pi$ 生成状态 $i_1$
2. $t=1$
3. 按状态 $i_t$ 的观测概率分布 $b_{i_t}(k)$ 生成 $o_t$
4. 按状态 $i_t$ 的状态转移概率分布 $\{a_{i_ti_{t+1}}\}$ 昌盛状态 $i_{t+1}$
5. $t=t+1$ ，转到3，直到 $t=T$

HMM的三个基本问题

概率计算问题。给定模型 $\lambda=(A,B,\pi)$ 和观测序列 $O=(o_1,o_2,...,o_T)$ ，计算 $P(O|\lambda)$
学习问题。一致观测序列 $O(o_1,o_2,...,o_T)$ ，估计模型 $\lambda=(A,B,\pi)$ 参数，使得在该模型下序列概率 $P(O|\lambda)$ 最大。即极大似然估计法
预测问题，即解码问题。已知模型 $\lambda=(A,B,\pi)$ 和观测序列 $O(o_1,o_2,...,o_T)$ ，求对给定观测序列的条件概率 $P(I|O)$ 最大的状态序列 $I=(i_1,i_2,...,i_T)$

2.概率计算算法

前向算法

(前向概率)定义：给定隐马尔可夫模型 $\lambda$ ，定义到时刻 $t$ 部分观测序列为 $o_1,o_2,...,o_t$ 且状态为 $q_i$ 的概率为前向概率，记做

$α t (i) = P (o 1, o 2, . . ., o t, i t = q i | λ)$ $\alpha_t(i)=P(o_1,o_2,...,o_t,i_t=q_i|\lambda)$

观测序列概率的前向算法
输入：隐马尔可夫模型 $\lambda$ ，观测序列 $O$
输出：观测序列概率 $P(O|\lambda)$
流程：
1. 初值。即时刻 $t=1$ ，状态为 $i$ 且观测为 $o_1$ 的概率

$α 1 (i) = π i b i (o 1); i = 1, 2, . . ., N$ $\alpha_1(i)=\pi_ib_i(o_1);i=1,2,...,N$
2. 递推。即上一时刻各个状态下，转移到状态 $i$ 的概率和，再计算观测为 $o_t+1$ 的概率
$α t + 1 (i) = [\sum j = 1 N α t (j) a j i] b i (o t + 1)$ $\alpha_{t+1}(i)=[\sum_{j=1}^{N}\alpha_t(j)a_{ji}]b_i(o_{t+1})$
3. 终止。
$P (O | λ) = \sum i = 1 N α T (i)$ $P(O|\lambda)=\sum_{i=1}^{N}\alpha_T(i)$

后向算法

(后向概率)定义：给定隐马尔可夫模型 $\lambda$ ，定义到时刻 $t$ 状态为 $q_i$ 的条件下，从t+1到T部分观测序列为 $o_{t+1},o_{t+2},...,o_T$ 的概率为后向概率，记做

$β t (i) = P (o t + 1, o t + 2, . . ., o T | i t = q i, λ)$ $\beta_t(i)=P(o_{t+1},o_{t+2},...,o_T|i_t=q_i,\lambda)$

观测序列概率的后向算法
输入：隐马尔可夫模型 $\lambda$ ，观测序列 $O$
输出：观测序列概率 $P(O|\lambda)$
流程：
1. 初值。

$β T (i) = 1$ $\beta_T(i)=1$
2. 递推。
$β t (i) = \sum j = 1 N a i j b j (o t + 1) β t + 1 (j)$ $\beta_t(i)=\sum_{j=1}^{N}a_{ij}b_j(o_{t+1})\beta_{t+1}(j)$
3. 终止。
$P (O | λ) = \sum i = 1 N π i b i (o 1) β 1 (i)$ $P(O|\lambda)=\sum_{i=1}^{N}\pi_ib_i(o_1)\beta_1(i)$

其他一些公式

利用前后向概率定义可以将序列概率如下。其中，t=T-1和t=1时，分别为前后向概率公式

$P (O | λ) = \sum i = 1 N \sum j = 1 N α t (i) a i j b j (o t + 1) β t + 1 (j)$ $P(O|\lambda)=\sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_t(i) a_{ij} b_j(o_{t+1}) \beta_{t+1}(j)$
给定模型 $\lambda$ 和观测 $O$ ，在时刻 $t$ 处于状态 $q_i$ 的概率，记为

$γ t (i) = P (i t = q i | O, λ) = P ( i t = q i , O | λ ) P ( O | λ )$ $\gamma_t(i)=P(i_t=q_i|O,\lambda)=\frac{P(i_t=q_i,O|\lambda)}{P(O|\lambda)}$
由前后向概率定义有
$α t (i) β t (i) = P (i t = q i, O | λ)$ $\alpha_t(i) \beta_t(i)=P(i_t=q_i,O|\lambda)$
所以

$γ t (i) = α t ( i ) β t ( i ) P ( O | λ ) = α t ( i ) β t ( i ) \sum N j = 1 α t ( j ) β t ( j )$ $\gamma_t(i)=\frac{\alpha_t(i) \beta_t(i)}{P(O|\lambda)}=\frac{\alpha_t(i) \beta_t(i)}{\sum_{j=1}^{N}\alpha_t(j) \beta_t(j)}$
给定模型 $\lambda$ 和观测 $O$ ，在时刻 $t$ 处于状态 $q_i$ 且在时刻 $t+1$ 处于状态 $q_j$ 的概率为

$ξ t (i, j) = P (i t = q i, i t + 1 = q j | O, λ) = P ( i t = q i , i t + 1 = q j , O | λ ) P ( O | λ ) = P ( i t = q i , i t + 1 = q j | O , λ ) \sum N i = 1 \sum N j = 1 P ( i t = q i , i t + 1 = q j , O | λ ) = α t ( i ) a i j b j ( o t + 1 ) β t + 1 ( j ) \sum N i = 1 \sum N j = 1 P ( i t = q i , i t + 1 = q j , O | λ )$ $\begin{align*} \xi_t(i,j)&=P(i_t=q_i,i_{t+1}=q_j|O,\lambda)\\ &=\frac{P(i_t=q_i,i_{t+1}=q_j,O|\lambda)}{P(O|\lambda)}\\ &=\frac{P(i_t=q_i,i_{t+1}=q_j|O,\lambda)}{\sum_{i=1}^{N} \sum_{j=1}^{N} P(i_t=q_i,i_{t+1}=q_j,O|\lambda)}\\ &=\frac{ \alpha_t(i) a_{ij} b_j(o_{t+1}) \beta_{t+1}(j)}{\sum_{i=1}^{N} \sum_{j=1}^{N} P(i_t=q_i,i_{t+1}=q_j,O|\lambda)} \end{align*}$
在观测 $O$ 下状态 $i$ 出现的期望

$\sum t = 1 T γ t (i)$ $\sum_{t=1}^{T}\gamma_t(i)$
在观测 $O$ 下状态 $i$ 转义的期望值
$\sum t = 1 T - 1 γ t (i)$ $\sum_{t=1}^{T-1}\gamma_t(i)$
在观测 $O$ 下状态 $i$ 转移到状态 $j$ 的期望值
$\sum_{t = 1}^{T - 1} ξ_{t} (i, j)$ $\sum_{t=1}^{T-1}\xi_t(i,j)$

学习算法

可以通过监督学习的极大似然估计解
或通过非监督的Baum-Welch算法（EM算法）求解

预测算法

主要解决给定模型和观测序列的情况下，最大概率的状态序列。
通过近似算法(取每个时刻最优)或维特比算法(动态规划)

地图匹配

基础数据：GPS轨迹点+道路网
应用：轨迹分类、轨迹离群值/异常检测、轨迹不确定性、轨迹模式挖掘
流程：基础数据->数据清洗->建立索引->选取候选路段->确定匹配路段
按依据信息划分：
1）几何匹配：点到点、点到线、线到线
2）拓扑关系：简单拓扑(作为筛选)、加权拓扑(作为权重)
3）概率统计：置信区间匹配、新型概率匹配方法（绘制概率椭圆）
4）先进匹配算法：模糊逻辑、证据理论、卡尔曼滤波、贝叶斯推理
问题：噪声和数据稀疏
按采样点范围划分(按计算时间)：局部/增量的方法(online)、全局方法(offline)
按采样频率划分：高频、低频、更低频

HMM方法
1）隐含状态序列：路网
2）可观测序列：GPS点
3）状态转移概率矩阵A：t时刻i状态到t+1时刻j状态的概率，N*N；【状态中前后点越近概率越大；路段上的距离和观测上的距离越相近概率越大；考虑拓扑、考虑速度等】
4）观测概率矩阵B：t时刻i状态，观测到k的概率；【点与路段越近，概率越大】
5）初始状态概率矩阵 $\pi$ ：表示初始状态的概率

煎饼证

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HMM隐马尔科夫模型

对HMM做概述，主要摘抄自《统计学习方法》，概率计算为主，对学习和预测算法暂时忽略。最后补充一些HMM在地图匹配上的应用1.HMM定义和理解隐马尔可夫模型(Hidden Markov Model)，标注问题，生成模型。定义：隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序...
复制链接

扫一扫