HMM模型与viterbi算法

最新推荐文章于 2022-04-30 19:24:38 发布

Claire_Mk

最新推荐文章于 2022-04-30 19:24:38 发布

阅读量361

点赞数

文章标签：算法概率论机器学习

本文链接：https://blog.csdn.net/Claire_Mk/article/details/122031577

版权

2021SC@SDUSC
HMM(Hidden Markov Model): 隐式马尔科夫模型。HMM 模型可以应用在很多领域，所以它的模型参数描述一般都比较抽象，HMM 的典型介绍就是这个模型是一个五元组:
StatusSet: 状态值集合
ObservedSet: 观察值集合
TransProbMatrix: 转移概率矩阵
EmitProbMatrix: 发射概率矩阵
InitStatus: 初始状态分布
而在jieba分词中我们应用隐马尔科夫模型来解决参数(ObservedSet,TransProbMatrix,EmitRobMatrix,InitStatus)已知的情况下，求解状态值序列。(viterbi算法)。维特比算法就是求所有观测序列中的最优，并且是用动态规划的方法就减少这些重复计算。算法对于每一个状态要记录一个三元组：(prob, v_path, v_prob)，其中，prob是从开始状态到当前状态所有路径（不仅仅是最有可能的viterbi路径）的概率加在一起的结果（作为算法附产品，它可以输出一个观察序列在给定HMM下总的出现概率，即forward算法的输出），v_path是从开始状态一直到当前状态的viterbi路径，v_prob则是该路径的概率。
算法开始，初始化T （T是一个Map，将每一种可能状态映射到上面所说的三元组上）三重循环，对每个一活动y，考虑下一步每一个可能的状态next_state，并重新计算若从T中的当前状态state跃迁到next_state概率会有怎样的变化。跃迁主要考虑联合概率。所有下一步状态考虑完后，要从T中找出最优的选择viterbi路径——即概率最大的viterbi路径，即上面更新Map U的代码U[next_state] = (total, argmax, valmax)。

算法最后还要对T中的各种情况总结，对total求和，选择其中一条作为最优的viterbi路径。


def viterbi(obs, states, start_p, trans_p, emit_p):
    V = [{}]  # tabular
    mem_path = [{}]
    all_states = trans_p.keys()
    for y in states.get(obs[0], all_states):  # init
        V[0][y] = start_p[y] + emit_p[y].get(obs[0], MIN_FLOAT)
        mem_path[0][y] = ''
    for t in xrange(1, len(obs)):
        V.append({})
        mem_path.append({})
        #prev_states = get_top_states(V[t-1])
        prev_states = [
            x for x in mem_path[t - 1].keys() if len(trans_p[x]) > 0]

        prev_states_expect_next = set(
            (y for x in prev_states for y in trans_p[x].keys()))
        obs_states = set(
            states.get(obs[t], all_states)) & prev_states_expect_next

        if not obs_states:
            obs_states = prev_states_expect_next if prev_states_expect_next else all_states

        for y in obs_states:
            prob, state = max((V[t - 1][y0] + trans_p[y0].get(y, MIN_INF) +
                               emit_p[y].get(obs[t], MIN_FLOAT), y0) for y0 in prev_states)
            V[t][y] = prob
            mem_path[t][y] = state

    last = [(V[-1][y], y) for y in mem_path[-1].keys()]
    # if len(last)==0:
    #     print obs
    prob, state = max(last)

    route = [None] * len(obs)
    i = len(obs) - 1
    while i >= 0:
        route[i] = state
        state = mem_path[i][state]
        i -= 1
    return (prob, route)

Claire_Mk

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HMM模型与viterbi算法

2021SC@SDUSCHMM(Hidden Markov Model): 隐式马尔科夫模型。HMM 模型可以应用在很多领域，所以它的模型参数描述一般都比较抽象，HMM 的典型介绍就是这个模型是一个五元组:StatusSet: 状态值集合ObservedSet: 观察值集合TransProbMatrix: 转移概率矩阵EmitProbMatrix: 发射概率矩阵InitStatus: 初始状态分布而在jieba分词中我们应用隐马尔科夫模型来解决参数(ObservedSet,TransProbM
复制链接

扫一扫