隐马尔科夫模型（四）

最新推荐文章于 2022-12-07 23:13:04 发布

zhlei12345

最新推荐文章于 2022-12-07 23:13:04 发布

阅读量408

点赞数

分类专栏：统计/数学机器学习文章标签：隐马尔科夫模型概率随机过程

本文链接：https://blog.csdn.net/zhlei12345/article/details/45599243

版权

统计/数学同时被 2 个专栏收录

16 篇文章 5 订阅

订阅专栏

机器学习

12 篇文章 1 订阅

订阅专栏

$\quad\quad$ 本文主要解决隐马尔科夫模型基本问题三。给定观测序列组成的训练集，也就是多个观测序列，对模型λ进行估计，使得产生这个训练集的概率最大化,也就是最大似然估计。
$\quad\quad$ 首先我们先明确一下所使用的符号：

$S=\{S_1,...,S_N\}$ 表示模型的状态，一共有N个
$V=\{v_i,...v_M\}$ 表示不同的观测符号，一共有M个
$O^k={O_1^k...O_T^k}$ 表示第k个观测序列，序列长度为 $T$
$Q^k=q^k_1...q^k_T$ 表示第k个观测序列所对应的状态序列
$\chi=\{O^k\}_{k=1,...,K}$ ，表示观测序列集，我们假设有 $K$ 个观测序列.
$Z=\{Q^k\}_{k=1,...,K}$ ,表示状态序列集
$\lambda=\{A,B,\Pi\}$ ，其中 $A$ 表示状态转移矩阵， $B$ 表示状态与观测值之间的条件概率， $\Pi$ 表示初试状态概率

$\quad\quad$ 我们用公式来表示问题三就是求 $\lambda^*$ ，使得

λ * = a r g m a x λ P (χ | λ)

$\lambda^*=argmax_\lambda P(\chi|\lambda)$

$\quad\quad$ 我们运用EM算法来求解。但是我们并不在此多解释EM算法的由来，所以我们直接写出E-步和M-步。

$\textbf{E-step}$

W (λ, λ s) = \sum Z l o g [P (χ, Z | λ)] P (Z | χ; λ s)

$W(\lambda,\lambda^s)=\sum_{ Z}log[P(\chi,Z|\lambda)] P(Z|\chi;\lambda^s)$

M-step $\textbf{M-step}$

λ s + 1 = a r g m a x λ W (λ, λ s)

$\lambda^{s+1}=argmax_{\lambda}W(\lambda,\lambda^s)$

$\quad\quad$
我们首先对E-步的式子进行等价变化

W (λ, λ s) = \sum Z l o g [P (χ, Z | λ)] P (Z, χ | λ s) (1)

$W(\lambda,\lambda^s)=\sum_{Z}log[P(\chi,Z|\lambda)] P(Z,\chi|\lambda^s) \tag 1$
然后我们推导出

[P (χ, Z | λ)] = \prod k = 1 K P (O k, Q k | λ)

$[P(\chi,Z|\lambda)]=\prod_{k=1}^KP(O^k,Q^k|\lambda)$

P (O k, Q k | λ) = π q k 1 b q k 1 (O k 1) \prod t = 2 T a q k t - 1 q k t b q k t (O k t)

$P(O^k,Q^k|\lambda)=\pi_{q_1^k}b_{q_1^k}(O_1^k)\prod_{t=2}^T a_{{q_{t-1}^k}{q_t^k}}b_{q_t^k}(O_t^k)$
然后，我们取对数，代入公式(1),我们可得下式

W (λ, λ s) = \sum Z \sum k = 1 K l o g π q k 1 + \sum Z \sum k = 1 K \sum t = 2 T l o g a q k t - 1 q k t + \sum Z \sum k = 1 K \sum t = 1 T l o g b q k t (O k t)

$W(\lambda,\lambda^s)=\sum_Z \sum_{k=1}^K log\pi_{q_1^k}+\sum_Z \sum_{k=1}^K \sum_{t=2}^Tlog a_{q_{t-1}^k q_t^k}+\sum_Z \sum_{k=1}^K\sum_{t=1}^Tlog b_{q_t^k}(O_t^k)$
这样，我们把

λ $\lambda$ 的三个参数分开写，加上如下的约束条件

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ \sum M i = 1 = 1 \sum M j = 1 a i j = 1, i = 1, . . ., M \sum N j = 1 b i (j) = 1, i = 1, . . ., M

$\begin{cases} \sum_{i=1}^M=1\\ \sum_{j=1}^Ma_{ij}=1,i={1,...,M} \\ \sum_{j=1}^N b_i(j)=1 ,i={1,...,M} \end{cases}$
针对每个参数进行求导，然后令其等于零，我们得到如下的表达式

π i = 1 K \sum k = 1 K P (q k 1 = i | χ, λ s)

$\pi_i=\frac 1 K \sum_{k=1}^K P(q_1^k=i|\chi,\lambda^s)$

a i j = \sum K k = 1 \sum T t = 2 P ( q k t - 1 = i , q d t = j | χ , λ s ) \sum K k = 1 \sum T t = 2 P ( q k t - 1 = i | χ , λ s )

$a_{ij}=\frac {\sum_{k=1}^K \sum_{t=2}^TP(q_{t-1}^k=i,q_t^d=j|\chi,\lambda^s)} {\sum_{k=1}^K \sum_{t=2}^TP(q_{t-1}^k=i|\chi,\lambda^s)}$

b i (j) = \sum K k = 1 \sum T t = 1 P ( q k t = i | χ , λ s ) I ( O k t = j ) \sum K k = 1 \sum T t = 1 P ( q k t = i | χ , λ s )

$b_i(j)=\frac {\sum_{k=1}^K \sum_{t=1}^T P(q_t^k=i|\chi,\lambda^s)I(O_t^k=j)}{\sum_{k=1}^K\sum_{t=1}^T P(q_t^k=i|\chi,\lambda^s)}$
那么剩下的问题就是求解如下两个式子

ξ t (i, j) = P (q t = S i, q t + 1 = S j | O, λ) = α t ( i ) a i j b j ( O t + 1 ) β t + 1 ( j ) \sum k \sum l α t ( k ) a k l b l ( O t + 1 ) β t + 1 ( l )

$\xi_t(i,j)=P(q_t=S_i,q_{t+1}=S_j|O,\lambda)=\frac {\alpha_t(i)a_{ij}b_j(O_{t+1})\beta_{t+1}(j)}{\sum_k\sum_l\alpha_t(k)a_{kl}b_l(O_{t+1})\beta_{t+1}(l)}$