HMM在工程中的应用

最新推荐文章于 2024-07-03 09:31:19 发布

beautyfairy

最新推荐文章于 2024-07-03 09:31:19 发布

阅读量789

点赞数

分类专栏： NLP 文章标签：自然语言处理算法人工智能

本文链接：https://blog.csdn.net/beautyfairy/article/details/122312621

版权

本文详细介绍了HMM在中文分词中的应用，包括HMM的基本思想、五元组模型、维特比算法及其在分词中的具体实现。通过理解状态值集合、观察值集合、转移和发射概率矩阵，以及初始状态分布，可以利用HMM解决中文分词问题，找到最可能出现的状态序列。此外，还探讨了模型的训练问题。

摘要由CSDN通过智能技术生成

整体框架

nlp的中文分词

了解分词原理
结合分词原理及知识点，对应理解马尔可夫原理
马尔科夫假设中提到维特比算法
常用的分词的库就是一个插件——jieba分词

知乎上看到的分词过程图：
请添加图片描述
了解了分词的大概过程：断句、标注、根据词典加载概率。

隐马尔可夫大概思想

举例理解隐马尔可夫思想

生活中有三种骰子：6个面、3个面和8个面，对应每个骰子会出现6种、3种、8种情况，如果只看最终的投掷结果（给定一个序列值），其实包含了：

隐含的状态，就是选择哪个骰子
可见的状态，骰子投出的数值

假设每个状态间转移的概率（选择骰子的概率）是固定的。就可以得到状态转移矩阵。
那么观测值序列出现概率的计算公式：
请添加图片描述

抽象思想（HMM模型五元组）

3种不同骰子：状态值集合（StatusSet）
可能出现的结果值：观察值集合（ObservedSet）
选择不同骰子的概率：转移概率矩阵（TransProbMatrix ）
选定骰子后投出某个值的概率：发射概率矩阵（EmitProbMatrix ）如:拿到D6这个骰子，投出6的概率是1/6。
最初状态：初始状态概率分布（InitStatus ）

所以，计算概率的方法就是：
初始状态概率分布、发射概率矩阵、转移概率矩阵的乘积。
当某个状态序列的概率值最大，则该状态序列即为，出现该观测值的情况下，最可能出现的状态序列。

使用场景

HMM模型最常用来解决参数（ObservedSet,TransProbMatrix,EmitRobMatrix,InitStatus）已知的情况下，求解状态值集合的问题，其中使用到viterbi算法。
（除中文分词，语音识别、新词发现、词性标注等场景都会用到）

五元组参数在中文分词中具体含义

五元的关系是通过Viterbi算法串接起来，ObservedSet观测值集合是Viterbi的输入，而StatusSet状态值集合是Viterbi输出，输入和输出之间Viterbi算法需要借助三个模型参数，分别是InitStatus初始状态概率分布，TransProbMatrix转移概率矩阵，EmitProbMatrix发射概率矩阵。
HMM模型的中文分词中，输入的是一个句子(也就是观察值序列)，输出是这个句子中每个字的状态值。