机器学习笔记之高斯混合模型(一)模型介绍

引言

上一系列介绍了EM算法,本节将介绍第一个基于EM算法求解的概率生成模型——高斯混合模型(Gaussian Mixture Model,GMM)。

高斯混合模型介绍

示例介绍

首先观察一张关于样本集合 X \mathcal X X的分布图:
请添加图片描述
从观察的视角对 X \mathcal X X的分布进行分析,感觉上述样本点明显存在两堆,当然也可以认为是一堆样本,可能是样本没有全部生成完而已。但从常理角度观察 更像是两种不同分布的样本点存在于同一个样本空间中

我们假设上述两堆样本点每一堆均服从高斯分布,尝试对上述样本点横坐标的概率密度函数(Probability Density Function,PDF)进行表示
请添加图片描述
该图意义是概率密度函数结果越高,该样本点存在更大的概率被产生出来
观察上述所有样本点的横坐标,发现 以0.8和2.1这两个位置为中心,横坐标值围绕这两个中心产生的更密集,而其他位置相对稀疏一些

因此,我们可以认为产生这些样本点的概率模型 P ( X ) P(\mathcal X) P(X)是由两个高斯分布混合在一起得到的混合模型。我们称这个概率模型 P ( X ) P(\mathcal X) P(X)高斯混合模型

从几何角度观察高斯混合模型

P ( X ) P(\mathcal X) P(X)也自然存在概率密度函数。依然以上述样本点横坐标作为示例,它的概率密度函数大致表示如下
请添加图片描述
其中这个蓝色线可看作概率分布 P ( X ) P(\mathcal X) P(X)产生的样本横坐标的概率密度函数。以第 i i i个样本的横坐标 x ( i ) x^{(i)} x(i)为例,它的具体计算方法如下:
x m i x ( i ) = f 1 ( x ( i ) ) f 1 ( x ( i ) ) + f 2 ( x ( i ) ) ⋅ f 1 ( x ( i ) ) + [ 1 − f 1 ( x ( i ) ) f 1 ( x ( i ) ) + f 2 ( x ( i ) ) ] ⋅ f 2 ( x ( i ) ) = [ f 1 ( x ( i ) ) ] 2 + [ f ( x ( i ) ) ] 2 f 1 ( x ( i ) ) + f 2 ( x ( i ) ) \begin{aligned}x_{mix}^{(i)} & = \frac{f_1(x^{(i)})}{f_1(x^{(i)}) + f_2(x^{(i)})} \cdot f_1(x^{(i)}) + \left[1 - \frac{f_1(x^{(i)})}{f_1(x^{(i)}) + f_2(x^{(i)})}\right] \cdot f_2(x^{(i)}) \\ & = \frac{[f_1(x^{(i)})]^2 + [f_(x^{(i)})]^2}{f_1(x^{(i)}) + f_2(x^{(i)})} \end{aligned} xmix(i)=f1(x(i))+f2(x(i))f1(x(i))f1(x(i))+[1f1(x(i))+f2(x(i))f1(x(i))]f2(x(i))=f1(x(i

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

静静的喝酒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值