隐马尔科夫模型基础

本文介绍了隐马尔科夫模型(HMM)的基础知识,包括模型的构成、两个基本假设和三个核心问题。HMM在自然语言处理、语音识别等领域有广泛应用。尽管现代有更强大的模型,但HMM作为经典统计模型,其基本原理对学习其他算法至关重要。文章还详细阐述了评估、学习和解码问题,并提到了前向概率、后向概率、Baum-Welch算法和维特比算法等关键概念。
摘要由CSDN通过智能技术生成
  1. ​引言

      隐马尔可夫模型(Hidden Markov model, HMM)是用于序列标注的概率图模型,描述一个隐藏的马尔科夫链生成不可观测的状态序列,再由每个状态生成一个观测而产生一个观测序列的过程,是一个生成模型。隐马尔可夫模型在自然语言处理、语音识别、模式识别等领域都应用广泛。在自然语言处理中,基于字标注的分词、词性标注、句法分析、命名实体识别等领域都可以应用隐马尔可夫模型。

        虽然现在深度学习大行其道,HMM(在训练数据充足的情况下)也不如条件随机场(Conditional Random Field,CRF)强大,但是HMM依然是经典的统计分析模型,HMM包含的一些基本原理和概念,是学习其他算法的基础,比如随机采样中的马尔可夫-蒙特卡洛方法(Markov Chain Monte Carlo)用马尔科夫链产生样本序列,CRF中的随机场即马尔可夫随机场。因此,接下去我们简单的学习一下隐马尔科夫模型。

2.  隐马尔科夫模型的框架

       隐马尔可夫模型的基础内容其实非常简单,总结起来只需要记住“1、2、3”,即1个元组,2个假设,3个问题。

2.1 一个元组

        1个元组就是隐马尔可夫模型的参数元组,即组成隐马尔科夫模型的要素。一般来说是一个三元组  或者一个五元组  。五元组比三元组多了一个可能的状态集合Q和可能的观测集合V。Q和V是模型预设而不需要训练的参数(可认为是两个超参数),A,B,  是隐马尔可夫模型需要训练的参数。

        A表示状态转移概率矩阵。假设可能的状态集合Q总共有N个状态,则A是一个N*N的方阵,即A=[a_{ij}]_{N\times N}a_{ij}表示t时刻从状态i转移到t+1时刻状态j的概率:

  a_{ij}=P(i_{t+1}=q_j|i_t=q_i)

注意这里包含了一个隐含的约束,从状态i转移到所有状态(包括他自己)的概率和为1即\Sigma_{j=1}^Na_{ij}=1

        B表示符号发射概率(仿射概率)矩阵。假设可能的状态集合Q共N个状态,可能的观测集合总共由M个观测,则B是一个N*M的矩阵,即B=[b_j(k)]_{N\times M},其中b_j(k)表示t时刻从状态j生成观测k的概率:

  b_j(k)=P(o_t=v_k|i_t=q_j)

同样这里包含一个隐含约束条件\Sigma_{k=1}^Mb_j(k)=1

        \pi是初始状态概率分布向量,即在初始时刻(t=1)状态的概率分布\pi=(\pi_i),其中\pi_i=P(i_1=q_i)

2.2 两个假设

        三元组决定了隐马尔可夫模型,和A决定了如何从隐藏的马尔可夫链生成状态序列I,B决定了如何从状态序列生成观测序列O。在这个过程中隐马尔可夫模型做了两个基本假设:

1)齐次马尔可夫性假设。

     假设隐藏的马尔科夫链在时刻t的状态只依赖于其前一刻(t-1时刻)的状态而与其他时刻的状态及观测无关,也与时刻t无关:

  P(i_t|i_{t-1},o_{t-1},\cdots,i_1,o_1)=P(i_t|i_{t-1})

2)观测独立性假设。

     假设任意时刻的观测只依赖于该时刻的马尔科夫链的状态,与其他观测以及状态无关:

  P(o_t|i_T,o_T,\cdots,i_{t+1},o_{t+1},i_t,i_{t-1},o_{t-1},\cdots,i_1,o_1)=P(o_t|i_t)

2.3 三个基本问题

        隐马尔科夫模型基于以上两个基本假设,生成一个长度为T的观测序列O=(o_1,o_2,\cdots,o_T)的过程如下:

       1)按照初始状态产生状态 i_1

       2)令t=1

       3)按照状态i_t的仿射概率分布生成观测o_t

       4)按照状态i_t的状态转移概率分布产生状态i_{t+1}

       5)令t=t+1,如果t小于T转到(3),否则终止;

隐马尔可夫模型的生成如下图所示:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值