隐马尔可夫模型（HMM）

最新推荐文章于 2023-01-05 15:04:24 发布

walter1990

最新推荐文章于 2023-01-05 15:04:24 发布

阅读量911

点赞数

本文链接：https://blog.csdn.net/suichen1/article/details/50467179

版权

隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的转态随机序列，再由各个转态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列，称为状态序列；每个状态生成一个观测，而由此产生的观测的随机序列，称为观测序列，序列的每一个位置又可以看作一个时刻。

隐马尔可夫模型由初始概率分布，状态转移概率分布以及观测概率分布确定。

HMM=（A，B，pai）

状态转移概率矩阵A和初始状态概率向量pai确定了隐藏的马尔可夫链，生成不可观测的状态序列。观测概率矩阵B确定了如何从状态生成观测，与状态序列综合确定了如何产生观测序列。

隐马尔可夫模型做了两个基本假设：

（1）齐次马尔可夫性假设，即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于前一时刻状态，与其他时刻的状态及观测无关，也与时刻t无关。

（2）观测独立性假设，即假设任意时刻的观测只依赖于该时刻的马尔可夫链的转态，与其他观测及状态无关。

隐藏马尔可夫模型可以用于标注，这时状态对应着标记，标注问题是给定观测的序列预测其对应的标记序列。可以假设标注问题的数据是由隐马尔可夫模型生成的。这样我们就可以利用隐马尔可夫模型的学习与预测算法进行标注。

隐马尔可夫模型的三个基本问题：

1.概率计算问题。给定模型M=（A，B，pai）和观测序列O=（o1,o2,..on），计算在模型下观测序列O出现的概率
P（O|M）

2.学习问题。已知观测序列O=（o1,o2,..on），估计模型M=（A，B，pai）参数，使得在该模型下观测序列P（O|M）最大。即用极大似然估计的方法估计参数

3.预测问题，也成为解码（decoding）。已知模型M=（A，B，pai）和观测序列O=（o1,o2,..on），求对给定观测序列条件概率P（I|O）最大的状态序列I=（i1,i2,..in）.即给定观测序列，求最有可能的对应的状态序列。

概率计算问题：

前向算法：给定隐马尔可夫模型模型M，定义到时刻t部分观测序列为o1，o2，...,ot且状态为qi的概率为前向概率，记做：at（i） = P（o1，o2，...，ot，it=qi|M）

可以递推地求得前向概率at（i）以及观测序列P（O|M）。

后向算法：

后向概率：给定隐马尔可夫模型，定义在时刻t状态为qi的条件下，从t+1到T的部分观测序列为ot+1,ot+2,..oT的概率记做后向概率。

学习算法：

隐马尔可夫模型的学习，根据训练数据是包括观测序列和对应的状态序列还是只有观测序列，可以分别由监督学习与非监督学习实现。

1.监督学习方法

假设已给训练数据包含S个长度相同的观测序列和对应的状态序列{（o1，I1），...，（On，In）}，可以用极大似然估计方法来估计隐马尔可夫模型的参数。

2.非监督学习方法

假设给定训练数据只包含S个长度为T的观测序列{（O1,...,Os）}而没有对应的状态序列，目标是学习隐马尔可夫模型M=（A，B，pai）的参数。

预测算法

近似算法和维特比算法。

维特比算法实际是用动态规划解隐马尔可夫模型预测问题，即用动态规划求概率最大路径。

我们只需要从时刻t=1开始，递推地计算在时刻t状态为i的各部分路径的最大概率，直至得到时刻t=T状态为i的各条路径的最大概率。时刻T的最大概率即为最优路径的概率P*，最优路径的终结点iT*也同时得到。之后为了找出最优路径的各个节点，从终结点iT*开始，由后向前逐步求得节点iT-1*，...，i1*,得到最优路径。这就是维特比算法。

java实现代码：

public class Viterbi {
    public static int[] compute(int[] obs, int[] states, double[] start_p, double[][] trans_p, double[][] emit_p)
    {
        double[][] V = new double[obs.length][states.length];
        int[][] path = new int[states.length][obs.length];

        for (int y : states)
        {
            V[0][y] = start_p[y] * emit_p[y][obs[0]];
        }

        for (int t = 1; t < obs.length; ++t)
        {
            for (int y : states)
            {
                double prob = -1, tmp=-1;
                int state = -1;
                for (int y0 : states)
                {
                    double nprob = V[t - 1][y0] * trans_p[y0][y] * emit_p[y][obs[t]];
                    double nstate = V[t-1][y0]*trans_p[y0][y];
                    if (nprob > prob)
                    {
                        prob = nprob;
                    }

                    if(nstate > tmp) {
                        state = y0;
                        tmp = nstate;
                    }

                }

                V[t][y] = prob;
                path[y][t-1] = state;
            }

        }

        double prob = -1;
        int state = 0;
        for (int y : states)
        {
            if (V[obs.length - 1][y] > prob)
            {
                prob = V[obs.length - 1][y];
                state = y;
            }
        }

        int[] ans = new int[obs.length];
        int cnt = obs.length-1;
        ans[cnt--] = state;

        while (cnt >= 0) {
            state = path[state][cnt];
            ans[cnt--] = state;
        }
        return ans;
    }
}

public class Main {
    static enum Weather
    {
        Rainy,
        Sunny,
    }
    static enum Activity
    {
        walk,
        shop,
        clean,
    }

    static int[] states = new int[]{Rainy.ordinal(), Sunny.ordinal()};
    static int[] observations = new int[]{walk.ordinal(), shop.ordinal(), clean.ordinal()};
    static double[] start_probability = new double[]{0.6, 0.4};
    static double[][] transititon_probability = new double[][]{
            {0.7, 0.3},
            {0.4, 0.6},
    };
    static double[][] emission_probability = new double[][]{
            {0.1, 0.4, 0.5},
            {0.6, 0.3, 0.1},
    };

    public static void main(String[] args)
    {
        int[] result = Viterbi.compute(observations, states, start_probability, transititon_probability, emission_probability);
        for (int r : result)
        {
            System.out.print(Weather.values()[r] + " ");
        }
        System.out.println();
    }
}