机器学习-白板推导系列笔记（十一）-GMM

最新推荐文章于 2021-02-20 11:50:50 发布

VIP文章及时行樂_

最新推荐文章于 2021-02-20 11:50:50 发布

阅读量595

点赞数 1

分类专栏：哔站机器学习白板推导文章标签：机器学习

本文链接：https://blog.csdn.net/qq_41485273/article/details/111564153

版权

此文章主要是结合哔站shuhuai008大佬的白板推导视频：GMM_95min

全部笔记的汇总贴：机器学习-白板推导系列笔记

一、模型介绍

（一）几何角度

可以认为高斯混合模型是将多个高斯分布加权平均而成的模型：

$p(x)=\sum_{k=1}^{K}\alpha _{k}N(\mu _{k},\Sigma _{k}),\sum_{k=1}^{K}\alpha _{k}=1$

（二）混合模型（或者生成模型）角度

可以认为高斯混合模型是一种含有隐变量的生成模型：

$x$ :observed variable
$z$ :latent variable

$z$ 是隐变量，表示对应的样本 $x$ 属于哪一个高斯分布，其概率分为如下表：

$z$	$p$
$C_1$	$p_1$
$C_2$	$p_2$
$\cdots$	$\cdots$
$C_k$	$p_k$

可以认为这里的概率 $p_k$ 就是几何角度加权平均中权重，两种角度的解释其实是一个意思。

二、用极大似然估计来求解

$data\rightarrow X=(x_{1},x_{2},\cdots ,x_{N})$
$(X, Z) : c o m l e t e d a t a$
$\theta:parameter\rightarrow \theta =\left \{p_{1},p_{2},\cdots ,p_{k},\mu _{1},\mu _{2},\cdots ,\mu _{k},\Sigma _{1},\Sigma _{2},\cdots ,\Sigma _{k}\right \},\sum_{i=1}^{K}p_{k}=1$

以上为我们的数据以及需要求解的参数。接下来我们表示一下概率 $p (x)$ :

$p(x)=\sum _{z}p(x,z)\\ =\sum _{k=1}^{K}p(x,z=C_{k})\\ =\sum _{k=1}^{K}p(z=C_{k})\cdot p(x|z=C_{k})\\ =\sum _{k=1}^{K}p_{k}\cdot N(x|\mu _{k},\Sigma _{k})$

然后我们使用极大似然估计法求解这个参数估计问题，

$\hat{\theta }_{MLE}=\underset{\theta }{argmax}\; log\; p(X)\\ =\underset{\theta }{argmax}\; log\prod_{i=1}^{N}p(x_{i})\\ =\underset{\theta }{argmax}\sum_{i=1}^{N}log\; p(x_{i})\\ =\underset{\theta }{argmax}\sum_{i=1}^{N}{\color{Red}{log\sum _{k=1}^{K}}}p_{k}\cdot N(x_{i}|\mu _{k},\Sigma _{k})$

极大似然估计法不能得到解析解的原因为 $l o g$ 函数内部出现了求和符号。当然我们可以使用梯度下降法来进行求解，但是对于含有隐变量的模型来说使用EM算法是更为合适的。

三、使用EM算法求解

由于使用EM算法需要用到联合概率 $p (x, z)$ 和后验 $p (z ∣ x)$ ，所有我们首先写出这两个概率的表示：

$p(x,z)=p(z)p(x|z)=p_{z}\cdot N(x|\mu _{z},\Sigma _{z})\\ p(z|x)=\frac{p(x,z)}{p(x)}=\frac{p_{z}\cdot N(x|\mu _{z},\Sigma _{z})}{\sum_{k=1}^{K}p_{k}\cdot N(x|\mu _{k},\Sigma _{k})}$

最低0.47元/天解锁文章

及时行樂_

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习-白板推导系列笔记（十一）-GMM

此文章主要是结合哔站shuhuai008大佬的白板推导视频：GMM_95min一、模型介绍（一）几何角度可以认为高斯混合模型是将多个高斯分布加权平均而成的模型：p(x)=∑k=1KαkN(μk,Σk),∑k=1Kαk=1p(x)=\sum_{k=1}^{K}\alpha _{k}N(\mu _{k},\Sigma _{k}),\sum_{k=1}^{K}\alpha _{k}=1p(x)=k=1∑KαkN(μk,Σk),k=1∑Kαk=1（二）混合模型（或者生成模型）角度可以认为
复制链接

扫一扫