GMM

最新推荐文章于 2021-05-16 00:00:13 发布

叶落叶子

最新推荐文章于 2021-05-16 00:00:13 发布

阅读量279

点赞数

分类专栏：国科大模式识别与机器学习文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/weixin_40485502/article/details/103924995

版权

15 篇文章 15 订阅

订阅专栏

	有监督	无监督	半监督
目标函数	$L=logp(X_l,Y_l\\|\theta)=\Sigma_{i=1}^llogp(y_i\\|\theta)p(x_i\\|y_i,\theta)\\=\Sigma_{i=1}^llog \alpha_{y_i}N(x_i\\|\theta_{y_i})$	$p(x;\theta)=\Pi_i^N\Sigma_{k=1}^K\pi_kN(x_i\\|\mu_k,\Sigma_k)$	$P(x_l,y_l,x_u\\|\theta)=\Sigma_{i=1}^llog \alpha_{y_i}N(x_i\\|\theta_{y_i})+\Sigma_{i=l}^mlog\Sigma_{k=1}^N\alpha_kN(x_i\\|\theta_k)$
E	求导解决	$求\gamma_{ik}=p(y_i=k\\|x_i)=\frac{\alpha_kN(x_i\\|\theta_k)}{\Sigma_{k=1}^N\alpha_kN(x_i\\|\theta_k)}$	$求\gamma_{ik}=p(y_i=k\\|x_i)=\frac{\alpha_kN(x_i\\|\theta_k)}{\Sigma_{k=1}^N\alpha_kN(x_i\\|\theta_k)}$
M	$\mu_k=\frac{1}{l_k}(\Sigma_{i\in D_l ,y_i=k}x_i)\\\Sigma_i=\frac{1}{l_k}(\Sigma_{i\in D_l ,y_i=k}(x_i-\mu_k)(x_i-\mu_k)^T)\\\alpha_k=\frac{l_k}{m}$	$\mu_k=\frac{\Sigma_i\gamma(z_{ik})x_i}{\gamma(z_{ik})}\\\pi_k=\frac{\Sigma_i\gamma(z_{ik})}{N}\\\Sigma_k=\frac{\Sigma_i\gamma(z_{ik})(x_i-\mu_k)(x_i-\mu_k)^T}{\gamma(z_{ik})}$	$\mu_k=\frac{1}{\Sigma_{i=l}^m\gamma_{ik}+l_k}(\Sigma_{i\in D_l ,y_i=k}x_i+\Sigma_{i=l}^m\gamma_{ik}x_i)\\\Sigma_i=\frac{1}{\Sigma_{i=l}^m\gamma_{ik}+l_k}(\Sigma_{i\in D_l ,y_i=k}(x_i-\mu_k)(x_i-\mu_k)^T+\Sigma_{i=l}^m\gamma_{ik}(x_i-\mu_k)(x_i-\mu_k)^T)\\\alpha_k=\frac{\Sigma_{i=l}^m\gamma_{ik}+l_k}{m}$
			半监督=无监督+有监督

有监督

目标函数： $L=logp(X_l,Y_l|\theta)=\Sigma_{i=1}^llogp(y_i|\theta)p(x_i|y_i,\theta),\theta_i={\alpha_i,\mu_i,\Sigma_i}$
$=\Sigma_{i=1}^llog \alpha_{y_i}N(x_i|\theta_{y_i}) \\=\Sigma_{i=1}^l(log\alpha_{y_i}-\frac{n}{2}log(2\pi)-\frac{1}{2}log(|\Sigma_{y_i}|)-(x_i-\mu_{y_i})^T\Sigma_{y_i}^{-1}(x_i-\mu_{y_i})$
直接求导得到结果
$\mu_k=\frac{1}{l_k}(\Sigma_{i\in D_l ,y_i=k}x_i)\\ \Sigma_i=\frac{1}{l_k}(\Sigma_{i\in D_l ,y_i=k}(x_i-\mu_k)(x_i-\mu_k)^T)\\ \alpha_k=\frac{l_k}{m}$

在这里插入图片描述

概率解释: 假设有K个簇，每一个簇服从高斯分布，以概率π𝑘随机选择一个簇 k ，从其分布中采样出一个样本点，如此得到观测数据
N个样本点𝒙的似然函数(Likelihood)
- $p(x;\theta)=\Pi_i^N\Sigma_{k=1}^K\pi_kN(x_i|\mu_k,\Sigma_k),其中\Sigma_k\pi_k=1,0\leq \pi_k\leq 1$
- 引入隐变量，指示所属类,k维独热表示
  - $p(z_k=1)=\pi_k$
  - $p(x_i|z)=\Pi_k^KN(x_i|\mu_k,\Sigma_k)^{z_k}$
    - $p(x_i|z_k=1)=N(x_i|\mu_k,\Sigma_k)$
  - $p(x_i)=\Sigma_zp(x_i|z)p(z)=\Sigma_{k=1}^K\pi_kN(x_i|\mu_k,\Sigma_k)$
从属度(可以看做，xi属于第k个簇的解释
- $\gamma(z_{ik})\\=p(z_{ik=1}|x_i)\\=\frac{p(z_{ik}=1)p(x_i|z_k=1)}{\Sigma_{k=1}^Kp(z_{ik}=1)p(x_i|z_k=1)}\\=\frac{\pi_kN(x_i|\mu_k,\Sigma_k)}{\Sigma_{k=1}^K\pi_kN(x_i|\mu_k,\Sigma_k)}$

目标：最大化 $P(x|\theta)=\Sigma_zp(x,z|\theta)$
- 直接优化 $P(x|\theta)$ 很困难，但优化完整数据的 $p(x,z|\theta)$ 容易
证明
- 分解
- 对任意分布q(z),下列分解成立
  - $lnp(x|\theta)=L(q,\theta)+KL(q||p)\\其中，\\L(q,\theta)=\Sigma_zq(z)ln(\frac{p(x,z|\theta)}{q(z)})\\KL(q||p)=-\Sigma_zq(z)ln(\frac{p(z|x,\theta)}{q(z)})\\KL(q||p)\geq0,L(q,\theta)是lnp(x|\theta)的下界$
- E： $最大化L(q,\theta),\\q(z)=P(z|x,\theta^{old})$
- $M:原来的下界L(q,\theta)=\Sigma_zP(z|x,\theta^{old})ln(\frac{p(x,z|\theta)}{q(z)})=Q(\theta,\theta^{old})+const---正好是期望$
- 下界提升了

目标函数： $L=logp(X_l,Y_l,X_u|\theta)=\Sigma_{i=1}^llogp(y_i|\theta)p(x_i|y_i,\theta)+\Sigma_{i=l+1}^mlog(\Sigma_{k=1}^Np(y_i=k|\theta)p(x_i|y_i=k,\theta)),\theta_i={\alpha_i,\mu_i,\Sigma_i}$
$=\Sigma_{i=1}^llog \alpha_{y_i}N(x_i|\theta_{y_i})+\Sigma_{i=l}^mlog\Sigma_{k=1}^N\alpha_kN(x_i|\theta_k) \\=\Sigma_{i=1}^l(log\alpha_{y_i}-\frac{n}{2}log(2\pi)-\frac{1}{2}log(|\Sigma_{y_i}|)-(x_i-\mu_{y_i})^T\Sigma_{y_i}^{-1}(x_i-\mu_{y_i})+\Sigma_{i=l}^mlog(\Sigma_{k=1}^N(\alpha_k{{1} \over {(2\pi)^{n/2}|\Sigma_k|^{1/2}}} exp\{ -{{1} \over {2}}(x_i-\mu_k)^T{\Sigma_k}^{-1}(x_i-\mu_k)\}))$
E： $求\gamma_{ik}=p(y_i=k|x_i)=\frac{\alpha_kN(x_i|\theta_k)}{\Sigma_{k=1}^N\alpha_kN(x_i|\theta_k)}$
M： $\mu_k=\frac{1}{\Sigma_{i=l}^m\gamma_{ik}+l_k}(\Sigma_{i\in D_l ,y_i=k}x_i+\Sigma_{i=l}^m\gamma_{ik}x_i)\\ \Sigma_i=\frac{1}{\Sigma_{i=l}^m\gamma_{ik}+l_k}(\Sigma_{i\in D_l ,y_i=k}(x_i-\mu_k)(x_i-\mu_k)^T+\Sigma_{i=l}^m\gamma_{ik}(x_i-\mu_k)(x_i-\mu_k)^T)\\ \alpha_k=\frac{\Sigma_{i=l}^m\gamma_{ik}+l_k}{m}$