EM算法及其应用GMM，pLSA

最新推荐文章于 2021-10-23 22:04:20 发布

一光年的梦

最新推荐文章于 2021-10-23 22:04:20 发布

阅读量404

点赞数

本文链接：https://blog.csdn.net/qq_30024069/article/details/88076752

版权

本文介绍了EM算法的原理和步骤，它用于处理含有隐变量的概率模型参数估计。接着详细阐述了GMM（高斯混合模型）和pLSA（概率潜在语义分析）的应用，涉及样本聚类和主题模型。通过EM算法进行模型参数更新，最终实现数据建模和分析。

摘要由CSDN通过智能技术生成

EM(expectation Maximization)期望最大是一种迭代算法，是一种对包含隐变量的概率模型，参数估计的极大似然估计法。第一步期望(E)：利用当前参数计算对数似然的期望；第二步最大化(M)步，寻找使E步产生的对数似然期望最大化的参数值。迭代使用EM步直到收敛。

提纲挈领：隐变量，极大似然估计

假设训练数据集{x^1,x^2.....x^m}包含m个独立样本，无样本标签，我们希望得到模型p(y|x)。开始下面工作：

1.EM

对于每个样本i，设Qi关于zj的分布，Qi(zj)

$\\ L(\theta)=\prod_{i=1}^{m} p(x_i;\theta)\\ l(\theta)=\sum_{i=1}^{m} logp(x_i;\theta)\\ =\sum_{i=1}^{m} log\sum_{j=1}^{k}p(x_i,z_j;\theta)\\ =\sum_{i=1}^{m}log \sum_{j=1}^{k}p(x_i,z_j;\theta)\\ =\sum_{i=1}^{m}log \sum_{j=1}^{k}p(x_i,z_j;\theta)\\ =\sum_{i=1}^{m}log \sum_{j=1}^{k} Q_i(z_j;\theta) \frac{p(x_i,z_j;\theta)}{Q_i(z_j;\theta)}\\ \geq \sum_{i=1}^{m} \sum_{j=1}^{k}Q_i(z_j;\theta) log \frac{p(x_i,z_j;\theta)}{Q_i(z_j;\theta)} \ \ \ \ \ \ (1)$