机器学习—高斯混合模型

最新推荐文章于 2022-12-09 17:32:57 发布

DCGJ666

最新推荐文章于 2022-12-09 17:32:57 发布

阅读量407

点赞数

分类专栏：深度学习文章标签：机器学习概率论算法

本文链接：https://blog.csdn.net/dcgj666/article/details/124924664

版权

深度学习专栏收录该内容

39 篇文章 1 订阅

订阅专栏

机器学习—高斯混合模型

- 极大似然估计
- EM求解GMM

为了解决高斯模型的单峰性的问题，我们引入多个高斯模型的加权平均来拟合多峰数据：

p(x)=\sum_{k=1}^K\alpha_k\mathcal{N}(\mu_k,\Sigma_k)

引入隐变量z，这个变量表示对应的样本x属于一个高斯分布，这个变量时一个离散的随机变量：

p(z=i)=p_i,\sum_{i=1}^kp(z=i)=1

作为一个生成式模型，高斯混合模型通过隐变量z的分布来生成样本。用概率图来表示：

在这里插入图片描述
其中，节点z就是上面的概率，x就是生成的高斯分布。于是对 $p (x)$ :
$p(x)=\sum_zp(x,z)=\sum_{k=1}^Kp(x,z=k)=\sum_{k=1}^Kp(z=k)p(x|z=k)$
因此：
$\sum_{k=1}^Kp_k\mathcal{N}(x|\mu_k,\Sigma_k)$

极大似然估计

样本为 $X=(x_1,x_2,...,x_N)$ , $(X, Z)$ 为完全参数，参数为 $\theta={p_1, p_2, ..., p_k, \mu_1, \mu_2,..., \mu_k,\Sigma_1,\Sigma_2,...,\Sigma_k}$ .我们通过极大似然估计得到 $\theta$ 的值：
$\theta_{MLE}=argmax_{\theta}logp(X)=argmax_{\theta}\sum_{i=1}^Nlogp(x_i)\\ =argmax_{\theta}\sum_{i=1}^Nlog\sum_{k=1}^Kp_k\mathcal{N}(x_i|\mu_k,\Sigma_k)$
这个表达式直接通过求导，由于连加号的存在，无法得到解析解。因此需要使用EM算法。

EM求解GMM

EM算法的基本表达式为： $\theta^{t+1}=\mathop{argmax}\limits_{\theta}\mathbb{E}_{z|x,\theta_t}[p(x,z|\theta)]$ 。套用GMM的表达式，对数据集来说：
$Q(\theta,\theta^t)=\sum\limits_z[\log\prod\limits_{i=1}^Np(x_i,z_i|\theta)]\prod \limits_{i=1}^Np(z_i|x_i,\theta^t)\\ =\sum\limits_z[\sum\limits_{i=1}^N\log p(x_i,z_i|\theta)]\prod \limits_{i=1}^Np(z_i|x_i,\theta^t)$
对于中间的那个求和号，展开，第一项为：
$\sum\limits_z\log p(x_1,z_1|\theta)\prod\limits_{i=1}^Np(z_i|x_i,\theta^t)=\sum\limits_z\log p(x_1,z_1|\theta)p(z_1|x_1,\theta^t)\prod\limits_{i=2}^Np(z_i|x_i,\theta^t)\\ =\sum\limits_{z_1}\log p(x_1,z_1|\theta) p(z_1|x_1,\theta^t)\sum\limits_{z_2,\cdots,z_K}\prod\limits_{i=2}^Np(z_i|x_i,\theta^t)\\ =\sum\limits_{z_1}\log p(x_1,z_1|\theta)p(z_1|x_1,\theta^t)$
类似地，Q可以写为：
$Q(\theta,\theta^t)=\sum\limits_{i=1}^N\sum\limits_{z_i}\log p(x_i,z_i|\theta)p(z_i|x_i,\theta^t)$
对于 $p(x,z|\theta)$ :
$p(x,z|\theta)=p(z|\theta)p(x|z,\theta)=p_z\mathcal{N}(x|\mu_z,\Sigma_z)$
代入 $Q$ :
$Q=\sum\limits_{i=1}^N\sum\limits_{z_i}\log p_{z_i}\mathcal{N(x_i|\mu_{z_i},\Sigma_{z_i})}\frac{p_{z_i}^t\mathcal{N}(x_i|\mu_{z_i}^t,\Sigma_{z_i}^t)}{\sum\limits_kp_k^t\mathcal{N}(x_i|\mu_k^t,\Sigma_k^t)}$
下面需要对Q值求最大值：
$Q=\sum\limits_{k=1}^K\sum\limits_{i=1}^N[\log p_k+\log \mathcal{N}(x_i|\mu_k,\Sigma_k)]p(z_i=k|x_i,\theta^t)$

$p_k^{t+1}$ :
$p_k^{t+1}=\mathop{argmax}_{p_k}\sum\limits_{k=1}^K\sum\limits_{i=1}^N[\log p_k+\log \mathcal{N}(x_i|\mu_k,\Sigma_k)]p(z_i=k|x_i,\theta^t)\ s.t.\ \sum\limits_{k=1}^Kp_k=1$
即：
$p_k^{t+1}=\mathop{argmax}_{p_k}\sum\limits_{k=1}^K\sum\limits_{i=1}^N\log p_kp(z_i=k|x_i,\theta^t)\ s.t.\ \sum\limits_{k=1}^Kp_k=1$
引入Lagrange乘子：
$L(p_k,\lambda)=\sum\limits_{k=1}^K\sum\limits_{i=1}^N\log p_kp(z_i=k|x_i,\theta^t)-\lambda(1-\sum\limits_{k=1}^Kp_k)$ 。所以：
$\frac{\partial}{\partial p_k}L=\sum\limits_{i=1}^N\frac{1}{p_k}p(z_i=k|x_i,\theta^t)+\lambda=0\\ \Rightarrow \sum\limits_k\sum\limits_{i=1}^N\frac{1}{p_k}p(z_i=k|x_i,\theta^t)+\lambda\sum\limits_kp_k=0\\ \Rightarrow\lambda=-N$
于是有：
$p_k^{t+1}=\frac{1}{N}\sum\limits_{i=1}^Np(z_i=k|x_i,\theta^t)$
$\mu_k,\Sigma_k$ ，这两个参数是无约束的，直接求导即可。

DCGJ666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习—高斯混合模型

机器学习—高斯混合模型极大似然估计EM求解GMM为了解决高斯模型的单峰性的问题，我们引入多个高斯模型的加权平均来拟合多峰数据：p(x)=∑k=1KαkN(μk,Σk)p(x)=\sum_{k=1}^K\alpha_k\mathcal{N}(\mu_k,\Sigma_k)p(x)=k=1∑KαkN(μk,Σk)引入隐变量z，这个变量表示对应的样本x属于一个高斯分布，这个变量时一个离散的随机变量：p(z=i)=pi,∑i=1kp(z=i)=1p(z=i)=p_i,\sum_{i=1}^kp(z=
复制链接

扫一扫