高斯混合模型GMM
注:该文章与《统计学习方法》by 李航 中的章节大致相同。
回顾EM算法的可以参考EM算法
高斯混合模型定义
高斯混合模型是指具有如下形式的概率分布模型:
一般可以用任意概率分布密度代替式(2)中的高斯分布。
GMM参数估计的EM算法
假设观测数据 y1,y2,...,yN 由高斯混合模型生成,
其中, θ=(α1,α2,...,αK;θ1,θ2,...,θK) 。我们使用 EM算法估计高斯混合模型的参数 θ 。
1. 明确隐变量,写完全数据对数似然函数
观测数据
yj,j=1,2,...,N
的是这样产生的:首先依概率
αk
选择第k个高斯分布模型
Φ(y|θk)
;然后依得到的高斯分布产生观测数据
yj
。此时,观测数据
yj,j=1,2,...,N
已知,但是我们根据观测数据
yj
并不能判断出来它来自于哪个高斯分布,我们以隐变量
γjk
表示观测观测数据
yj
来自于第k个高斯分布,如果
yj
来自第k个高斯分布模型,则
γjk=1
,否则
γjk=0
。
此时我们的完全数据(观测变量+隐变量)是:
我们可以写出 完全数据的似然函数:
那么 完全数据的对数似然概率为:
准备工作算是做完了,然后开始使用EM算法进行求解参数 θ 。
2. EM算法的E步
确定Q函数:
注意:这里的 Eγjk=E(γjk|y,θ(i)) !
记 γ^jk=Eγjk ,则 γ^jk 的求解过程如下:
γ^jk 是当前模型参数 θ(i) 下观测数据 yj 来自第k个高斯分布模型的概率,其中 j=1,2,...,N; k=1,2,...,K
将 γ^jk=Eγjk 以及 nk=∑Nj=1γjk 代入(1)式得:
现在我们可以看到,(2)式未知变量中只有 μk,σk 。下面就需要对该表达式进行极大化。
3. EM算法的M步
在M步,我们只需要求解函数 Q(θ,θ(i)) 对 θ 的极大值,即求解 θ(i+1) :
重复上述计算,直到对数似然函数值不再收敛为止。
参考
李航 《统计学习方法》