机器学习---概率图模型（概率计算问题）

三月七꧁ ꧂

于 2024-02-10 11:33:33 发布

阅读量1.2k

点赞数 25

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/weixin_43961909/article/details/136089945

版权

机器学习专栏收录该内容

73 篇文章 13 订阅

订阅专栏

1. 直接计算法

给定模型和观测序列，计算观测序列O出现的概率。最直接

的方法是按概率公式直接计算.通过列举所有可能的长度为T的状态序列，求各个状

态序列 I 与观测序列的联合概率，然后对所有可能的状态序列求和，得

到。
状态序列的概率是

对固定的状态序列，观测序列的概率是。

，O和I同时出现的联合概率为

。然后，对所有可能的状态序列I求和，得到观测序列O的概率

，即但是，利用公式计算

量很大，是阶的，这种算法不可行。

2. 前向算法

首先定义前向概率。给定隐马尔可夫模型λ，定义到时刻 t 部分观测序列为，且

状态为q1的概率为前向概率，记作。可以递推地求得前向概率α(i)

及观测序列概率。

算法：（观测序列概率的前向算法）输入：隐马尔可夫模型λ，观测序列O；输出：观测序列概率P

（O｜λ）。

初值：

递推：对，

终止：

如上图所示，前向算法实际是基于“状态序列的路径结构”递推计算P（O｜λ）的算法。前向算法高

效的关键是其局部计算前向概率，然后利用路径结构将前向概率“递推”到全局，得到P（O｜λ）．

具体地，在时刻t＝1，计算α1（i）的N个值（i＝1，2，···，N）；在各个时刻t＝1，2，···，T-1，

计算αt+1(i)的N个值（i＝1，2，···．，N），而且每个αt+1(i)的计算利用前一时刻N个αt(j)，减少计

算量的原因在于每一次计算直接引用前一个时刻的计算结果，避免重复计算。这样，利用前向概率

计算P（O｜λ）的计算量是阶的，而不是直接计算的阶。

前向算法的复杂度：

所以利用前向算法计算的计算量是阶的，当N＝3，T＝100时，

原始算法：大约需要10^(50)次运算；前向算法：计算次数小于2000次

前向算法Python实现分析：

import numpy as np  
  
def forward_algorithm(obs, states, start_p, trans_p, emit_p):  
    """  
    obs: 观察序列  
    states: 隐藏状态集合  
    start_p: 初始状态概率  
    trans_p: 状态转移概率  
    emit_p: 发射概率  
    """  
      
    T = len(obs)  
    N = len(states)  
      
    # 初始化alpha  
    alpha = np.zeros((T, N))  
    alpha[0, :] = start_p * emit_p[:, obs[0]]  
      
    # 递推计算alpha  
    for t in range(1, T):  
        for n in range(N):  
            alpha[t, n] = sum(alpha[t-1, :] * trans_p[:, n]) * emit_p[n, obs[t]]  
      
    # 计算观察序列的概率  
    P = sum(alpha[-1, :])  
      
    return P, alpha  
  
# 示例  
obs = [0, 1, 0]  # 观察序列  
states = [0, 1]  # 隐藏状态集合  
start_p = [0.6, 0.4]  # 初始状态概率  
trans_p = [[0.7, 0.3], [0.4, 0.6]]  # 状态转移概率  
emit_p = [[0.1, 0.9], [0.9, 0.1]]  # 发射概率  
  
P, alpha = forward_algorithm(obs, states, start_p, trans_p, emit_p)  
print(f"观察序列的概率: {P}")

3. 后向算法

后向概率：给定隐马尔可夫模型λ，定义在时刻t状态为q1的条件下，从t＋1到T的部分观测序列为

的概率为后向概率，记作

可以用递推的方法求得后向概率βt（i）及观测序列概率P（O｜λ）。

观测序列概率的后向算法：

输入：隐马尔可夫模型λ，观测序列O；输出：观测序列概率P（O｜λ）。

，对

后向算法Python实现分析：

import numpy as np  
  
def backward_algorithm(obs, states, start_p, trans_p, emit_p):  
    """  
    obs: 观察序列  
    states: 隐藏状态集合  
    start_p: 初始状态概率 (虽然后向算法本身不使用这个参数，但为了完整性仍然包括在参数列表中)  
    trans_p: 状态转移概率  
    emit_p: 发射概率  
    """  
      
    T = len(obs)  # 观察序列的长度  
    N = len(states)  # 隐藏状态的数量  
      
    # 初始化beta  
    beta = np.ones((T, N))  
      
    # 从观察序列的倒数第二个元素开始递推计算beta  
    for t in range(T - 2, -1, -1):  
        for n in range(N):  
            beta[t, n] = np.dot(beta[t + 1, :] * emit_p[:, obs[t + 1]], trans_p[n, :])  
      
    # 计算观察序列的概率  
    # 注意：这里我们实际上计算的是所有可能路径的概率之和，  
    # 但由于我们只需要这个总和，因此不需要显式地计算每个路径的概率。  
    # 初始状态概率start_p在后向算法中并不直接用于计算观察序列的概率，  
    # 但我们可以利用最后一步的beta和初始的发射概率来计算整个观察序列的概率。  
    # 这是一种不太常见的做法，因为我们通常使用前向-后向算法来计算概率，  
    # 该算法结合了前向和后向概率以避免数值下溢问题。  
    # 然而，为了这个示例的完整性，我们将展示如何使用beta来计算概率。  
    # 请注意，这种方法可能不是数值上最稳定的。  
      
    # 正确的做法是使用前向-后向算法中的一个步骤来计算概率，如下：  
    # P = sum(forward_probs[-1] * backward_probs[0]) (其中forward_probs和backward_probs是归一化的)  
    # 但在这个例子中，我们只实现后向算法，所以我们将使用一种简化的方法（可能不是最优的）。  
      
    # 计算最后一步的"后向概率"（未归一化）  
    last_step_backward = np.dot(beta[0, :] * emit_p[:, obs[0]], start_p)  
      
    # 由于我们没有计算前向概率，我们不能简单地通过前向和后向概率的乘积来归一化。  
    # 因此，我们将依赖这样一个事实：对于正确的模型参数，后向算法计算的beta应该使得下面的求和接近1（但不是严格的1，因为数值误差）。  
    # 在实际应用中，应该使用前向-后向算法来确保正确的归一化。  
      
    # 近似计算观察序列的概率（这不是标准做法，仅用于演示目的）  
    P = np.sum(last_step_backward)  
      
    return P, beta  
  
# 示例参数（同前向算法示例）  
obs = [0, 1, 0]  # 观察序列  
states = [0, 1]  # 隐藏状态集合（这里用整数表示状态）  
start_p = [0.6, 0.4]  # 初始状态概率（虽然后向算法不使用它来计算概率）  
trans_p = [[0.7, 0.3], [0.4, 0.6]]  # 状态转移概率  
emit_p = [[0.1, 0.9], [0.9, 0.1]]  # 发射概率  
  
# 调用后向算法函数并打印结果  
P, beta = backward_algorithm(obs, states, start_p, trans_p, emit_p)  
print(f"观察序列的概率（近似）: {P}")