隐马尔可夫模型：hmmlearn库的使用

最新推荐文章于 2024-08-09 07:12:40 发布

Starry memory

最新推荐文章于 2024-08-09 07:12:40 发布

阅读量8.2k

点赞数 29

分类专栏：人工智能自然语言处理文章标签：人工智能算法

本文链接：https://blog.csdn.net/doswynkfsw/article/details/124356671

版权

人工智能同时被 2 个专栏收录

41 篇文章 1 订阅

订阅专栏

自然语言处理

10 篇文章 0 订阅

订阅专栏

hmmlearn库的使用

安装和使用

hmmlearn 一共实现了三种HMM模型类，按照数据的观测状态是离散的还是连续的可以划分为两类。GaussianHMM （高斯HMM模型）和GMMHMM（混合高斯模型）是观测状态为连续的模型。 MultinomialHMM（多项式分布HMM模型）是观测状态为离散的模型。这三种算法都可以被用来估计模型的参数。
Hmmlearn以前是scikit-learn项目中的一部分，现在已经是一个单独的python包，可以在安装好python的基础上，直接使用下述命令进行安装。

pip install hmmlearn

安装好对应的hmmlearn库之后，我们可以直接在python代码中进行导入。

from hmmlearn import hmm

⾼斯HMM模型

高斯HMM模型指的是假定序列的观测状态是符合高斯分布的。隐藏状态的初始分布为 ${\boldsymbol{\pi}}$ ，对应的参数为“startprob_”。 ${\bf{A}}$ 是隐藏状态转移概率矩阵，对应的参数为“transmat_”，但是由于此时的观测状态是连续值，因此无法直接给出观测状态概率矩阵 ${\bf{B}}$ ，仅仅可以给出不同隐藏状态相对应的概率密度函数的参数。我们使用 ${\bf{\Sigma }}$ 表示服从高斯分布的协方差矩阵，使用 ${\boldsymbol{\mu}}$ 表示服从高斯分布的期望向量。在hmmlearn对应的GaussianHMM中， “covars”表示 ${\bf{\Sigma }}$ ，“means”表示不同隐藏状态对应的 ${\boldsymbol{\mu}}$ 形成的矩阵。

1.	import numpy as np
2.	from hmmlearn import hmm  
3.	startprob = np.array([0.6, 0.3, 0.1, 0.0])  
4.	# The transition matrix, note that there are no transitions possible  
5.	# between component 1 and 3  
6.	transmat = np.array([[0.7, 0.2, 0.0, 0.1],  
7.	                     [0.3, 0.5, 0.2, 0.0],  
8.	                     [0.0, 0.3, 0.5, 0.2],  
9.	                     [0.2, 0.0, 0.2, 0.6]])  
10.	# The means of each component  
11.	means = np.array([[0.0,  0.0],  
12.	                  [0.0, 11.0],  
13.	                  [9.0, 10.0],  
14.	                  [11.0, -1.0]]) 
15.	# The covariance of each component  
16.	covars = .5 * np.tile(np.identity(2), (4, 1, 1))  
17.	  
18.	# Build an HMM instance and set parameters  
19.	model3 = hmm.GaussianHMM(n_components=4, covariance_type="full")  
20.	
21.	# Instead of fitting it from the data, we directly set the estimated  
22.	# parameters, the means and covariance of the components  
23.	model3.startprob_ = startprob  
24.	model3.transmat_ = transmat  
25.	model3.means_ = means  
26.	model3.covars_ = covars

注意代码中的一个参数covariance_type，如果取值是“spherical”，那么 ${\bf{\Sigma }}$ 的非对角线元素的取值为0，并且对角线元素是相同的。如果取值是“diag”则 ${\bf{\Sigma }}$ 的非对角元素的取值是0，但对角线元素可以不同， “tied”表示隐藏状态所对应的观测状态的分布使用的 ${\bf{\Sigma }}$ 是相同的。可以通过上述代码，进行三维比特算法的解码过程。由于上述案例使用的是三维观测序列，所以这里需要输入三行两列的矩阵，代码如下：

1.	seen = np.array([[1.1,2.0],[-1,2.0],[3,7]])  
2.	logprob, state = model3.decode(seen, algorithm="viterbi")  
3.	print(state)

得到的结果为：
[0 0 1]

混合⾼斯分布HMM模型

对比高斯HMM模型，混合高斯分布的HMM模型指假定序列的观测状态是符合混合高斯分布的，即混合模型，模型是符合高斯分布的。一般情况下，我们通常假定观测序列的状态是符合混合高斯分布的。他的大部分参数和GaussianHMM是一样的，因此在这里不做过的讲解。

1.	hmmlearn.hmm.GMMHMM(n_components=1,n_mix=1,startprob_prior=1.0,
2.	transmat_prior=1.0, covariance_type='diag', covars_prior=0.01, algorithm='viterbi', 
3.	random_state=None,n_iter=10,tol=0.01, verbose=False, params='stmcw',init_params='stmcw')

对于GMMHMM与GuassianHMM中的不点主要有一下两个：
n_mix: 参数值表示的意思是混合高斯分布中，高斯分布的数量。如果n_min的取值为1，那么，GMMHMM退化为GaussianHMM模型。
means_prior, means_weight, covar_prior, covars_weight: 虽然参数的名称与GaussianHMM是相同的，但是他的维度数会因为n_mix的取值而改变。

多项式分布HMM模型

多项式分布HMM模型的使用是比较简单的，隐藏状态的初始分布为 $\boldsymbol{\pi}$ ，对应的参数为“startprob_”。 ${\bf{A}}$ 是隐藏状态转移概率矩阵，对应的参数为“transmit_” , ${\bf{B}}$ 是观测状态概率矩阵，对应的参数为“emissionprob_”。可以被用来解决HMM模型的解码问题和预测问题。对应于4.2节中求最可能的隐藏状态序列，我们使用hmmlearn库来进行求解。

1.	import numpy as np
2.	from hmmlearn import hmm  
3.	states = ["box 1", "box 2", "box3"]  
4.	n_states = len(states)  
5.	observations = ["red", "white"]  
6.	n_observations = len(observations)  
7.	pi = np.array([0.2, 0.4, 0.4])  
8.	A = np.array([  
9.	  [0.5, 0.2, 0.3],  
10.	  [0.3, 0.5, 0.2],  
11.	  [0.2, 0.3, 0.5]  
12.	])  
13.	 B = np.array([  
14.	  [0.5, 0.5],  
15.	  [0.4, 0.6],  
16.	  [0.7, 0.3]  
17.	])  
18.	model = hmm.MultinomialHMM(n_components=n_states)  
19.	model.startprob_= pi  
20.	model.transmat_= A  
21.	model.emissionprob_= B  
22.	seen_observe = np.array([[0,1,0]]).T  
23.	logprob, box = model.decode(seen_observe, algorithm="viterbi")  
24.	print("已知观测序列", ", ".join(map(lambda x: observations[x], seen_observe[:,0])))  
25.	print("最优隐藏状态", ", ".join(map(lambda x: states[x], box)))

对于多项式分布的HMM模型，也可以使用predict函数，预测结果是一样的，如下所示：

1.	box2 = model.predict(seen_observe)  
2.	print("已知观测序", ", ".join(map(lambda x: observations[x], seen_observe[:,0])))  
3.	print("最优隐藏状态", ", ".join(map(lambda x: states[x], box2)))