对于这些模型的介绍我打算从以下几个部分来写:
1:模型的基本概念
2:模型是如何应用于nlp当中的
3:相关论文
4:代码实现
HMM是隐马尔科夫模型的简称,这个模型的结构可以直接由下面的图来表示:其中蓝色方块表示的是状态序列,它是不可以被观测到的;红色圆圈表示观测序列,是可以直接观测到。而两个箭头都表示概率,黑色称为转换概率,红色称为发射概率。
HMM可以用三元符号表示:(A,B,Π),其中A是状态转移矩阵,B是发射矩阵,Π是初始时可能取到的隐含状态的概率矩阵。
因为我们只直到观测序列,那么就可以引出以下四个问题:
1:估计问题:我们想计算得到已知的这个观测序列的概率是多少。此时已知观测序列、状态序列、状态转移概率和发射概率,直接求解就可以了。
2:解码问题:我们想解开这个状态序列到底是什么样。此时已知观测序列、初始概率Π,隐含状态数量、状态转移概率,发射概率,未知的是隐状态序列。
3:学习问题:已知隐含状态数量,观测序列,求解转移概率、发射概率和初始矩阵Π。
哔哩哔哩上有很好的讲解视频
四个问题的解决算法:
问题1:前向或者后向算法