机器学习（7）-EM算法

最新推荐文章于 2022-05-06 21:20:29 发布

TasIsMe

最新推荐文章于 2022-05-06 21:20:29 发布

阅读量374

点赞数

分类专栏：机器学习文章标签：机器学习 em算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35885196/article/details/78705554

版权

机器学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

最大似然估计

在讲EM算法前，回顾下最大似然估计
最大似然估计解决的问题是，在不知道参数θ的情况下，只有数据，要猜出参数θ。
- 假设参数为θ
- 那么在θ参数出现的情况下，出现样本 $x_i$ 的概率就是 $p(x_i|θ)$
- 考虑所有样本,计算最大值，进行累乘法: $l(θ)=\prod_{i=1}^mp(x_i|θ)$
- 由于累乘计算难度比较大，加入一个对数转换为加法
  - 因为我们求得是最大值，即使加入对数也不会改变结果
  - logAB = logA + logB
  - 所以最大似然函数变成 $l(θ)=log\prod_{i=1}^mp(x_i|θ)=\sum_{i=1}^mlogp(x_i|θ)$
- 接下来只要知道 $p(x_i|θ)$ 的分布函数，就可以进行相关求解

EM算法解决什么问题

如果存在隐含变量，最大似然函数就难以求解
如：假设有两枚不均匀的硬币A和B，分别朝上和朝下的概率都不同，也就是不一定是0.5朝上，0.5朝下，要求这两个硬币的朝上和朝下的概率。
每次投掷10次，但是每次的结果我们不知道来自哪一个硬币，这个就是隐含变量。结合最大似然函数就是 $\sum_{i=1}^mlog\sum_zp(x_i|θ)$
$\sum_z$ 在此例子中表示两种情况，一种来自A，一种来自B，这样就难以求解。
em算法具体是怎么做的

0.随机或者根据经验假设初始值朝上的概率 $θ_A$ 和 $θ_B$
1.E-step:根据参数θ计算每个样本属于 $Z_i$ 的概率，也就是这个样本是属于A还是属于B的概率
2.M-Step：根据Q，求出含有θ的似然函数的下界并最大化它，得到新的参数θ
3.不断的迭代更新下去

EM算法推导

Jensen不等式

设f是定义域为实数的函数，如果对于所有的实数x。如果对于所有的实数x，f(x)的二次导数大于等于0，那么f是凸函数。
如果f是凸函数，X是随机变量，那么：E[f(X)]>=f(E[X])

这里写图片描述

如果是凹函数，则f(E[X])>=E[f(X)]
把函数 log∑zp(xi|θ) 转换为Jensen不等式格式求解
- $log\sum_zp(x_i|θ)=log\sum_zQ(z)\frac{p(x_i|θ)}{Q(z)}$
- $Q(z)$ 表示z的分布函数
- 由于 $\sum_zQ(z)\frac{p(x_i|θ)}{Q(z)}$ 是 $\frac{p(x_i|θ)}{Q(z)}$ 的期望
- 设Y= $\frac{p(x_i|θ)}{Q(z)}$ 则有： $log\sum_zQ(z)\frac{p(x_i|θ)}{Q(z)}=log\sum_YP(Y)Y=logE(Y)>=E(logY)$
- $E(logY)=\sum_YP(Y)logY=\sum_zQ(z)log\frac{p(x_i,z;θ)}{Q(z)}$
- 结论： $l(θ)=\sum_{i=1}^mlog\sum_zp(x_i,z;θ)>=\sum_{i=1}^m\sum_zQ(z)log\frac{p(x_i,z;θ)}{Q(z)}$
- 求下界的最大值,即左右相等的时候
- Jensen中等式成立的条件是随机变量是常数: $Y=\frac{p(x_,z;θ)}{Q(z)}=c$
- 由于Q(z)是z的分布函数： $\sum_zQ(z)=\sum_z\frac{p(x_i,z;θ)}{c}=1$
- 由上面的式子得: $c=\sum_zp(x_i,z;θ)$
- $Q(z)=\frac{p(x_i,z;θ)}{c}=\frac{p(x_i,z;θ)}{\sum_zp(x_i,z;θ)}=\frac{p(x_i,z;θ)}{p(x_i;θ)}=p(z|xi;θ)$
- Q(z)表示第i个数据来自 $Z_i$ 的概率

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习（7）-EM算法

最大似然估计在讲EM算法前，回顾下最大似然估计最大似然估计解决的问题是，在不知道参数θ的情况下，只有数据，要猜出参数θ。假设参数为θ那么在θ参数出现的情况下，出现样本xix_i的概率就是p(xi|θ)p(x_i|θ) 考虑所有样本,计算最大值，进行累乘法:l(θ)=∏mi=1p(xi|θ)l(θ)=\prod_{i=1}^mp(x_i|θ)由于累乘计算难度比较大，加入一个对数转换为加
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。