一、前言
之前介绍过马尔科夫模型(参考),提到马尔科夫的三个基本问题:
1、概率计算问题
2、学习问题
3、预测问题
这三个问题里面,比较常见是预测问题,也称为解码。在上面链接的文章里谈到有关这个问题的中文分词模型,下面给出一些解法。
二、基本介绍
1、概率模型
我们知道隐马尔科夫模型是一个概率模型,概率模型的基本思想可以参考:语言模型。
传统的概率统计模型自由参数数目随着序列长度的增加指数级增长,这种复杂度是无法接受的,所以针对传统统计概率模型已经提出许多方法:n-gram,神经概率等。
2、隐马尔科夫
与n-gram等方法相似,隐马尔科夫也是针对自由参数过多进行了优化。
假设观测序列为s,传统概率模型中P(s)是一个基于所有历史信息,即s序列的条件概率,随着序列长度增加而复杂度指数级增长。隐马尔科夫模型则提出一个隐藏的马尔科夫链的概念,它认为观测序列s是由隐藏的马尔科夫链随机生成观测序列的过程。而这个马尔科夫链序列可取值的范围是有限的,且相对s的可取值范围非常小。
同时,认为隐藏马尔科夫链的状态只与前一个状态有关,观测序列的取值只由马尔科夫链的状态