前面已经学习完词法,现在就可以学习语法了。语法学习中比较常用的是马尔可夫模型,然后进行词性标注,接着采用概率上下文无关文法学习人们说话的方式存在的一些结构和规则,最后采用概率句法分析来识别出高层次的结构但愿来简化句子的描述,实现语块分析。下面先来介绍马尔可夫模型。
markov模型,具体来说是隐形马尔可夫模型已经成为现代语音识别系统中构建统计模型的重要手段,即使存在不足,但仍然认为是最成功的运用在自然语言处理中的技术。为了区别不同的马尔可夫过程,我们把一般的马尔可夫模型称为显马尔可夫模型(VIsible Markov Model, VMM), 而通过假定额外的隐含结构,使模型在更高的抽象水平上进行操作,并且允许我们查看词语类别顺序,该模型称为隐形马尔可夫模型(Hide Markov Model, HMM)。
在显式马尔可夫模型中,机器的当前状态是已知的,因此状态系列或者它的一些确定函数被认为是输出。在隐形马尔可夫模型中,模型所经过的状态系列是未知的,我们只知道它的一些概率函数。可以看到,隐形马尔可夫模型输出之前,经过的状态是未知的,那么在什么情况下才可以使用隐性马尔可夫过程呢?
当系统中表层事件可能