EM算法实验内容及图片分类任务

最新推荐文章于 2024-06-11 16:55:08 发布

Vickyiiiiii

最新推荐文章于 2024-06-11 16:55:08 发布

阅读量1.7k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Vickyiiiiii/article/details/103404925

版权

EM算法实验内容

一、基本原理

简介

EM算法又称期望最大化算法，是一种迭代算法，是在概率模型中寻找参数极大似然估计的算法，其中概率模型依赖于无法观测的隐含变量。它主要用于从含有隐含变量的数据中计算极大似然估计。是解决存在隐含变量优化问题的有效方法。

简单推导

1. JENSEN不等式

设 $f$ 是定义域为实数的函数，如果对于所有的实数 $x$ ， $f ” (x) \geq 0$ ，那么 $f$ 是凸函数。

Jensen不等式表述如下：
$E (f (X)) \geq f (E (X))$

特别地，如果 $f$ 是严格凸函数，那么 $E (f (X)) = f (E (X))$ 当且仅当，也就是说 $X$ 是常量。

在这里插入图片描述
2. EM算法
（1）完整数据：

观测数据：观测到的随机变量 $X$ 样本
$X=(x_1,...,x_n)$
隐含变量：未观测到的随机变量 $Z$ 的值
$Z=(z_1,...z_n)$
完整数据：包含观测到的随机变量 $X$ 和隐含变量 $Z$ 的数据： $Y = (X, Z)$
$Y=((x_1,z_1),...(x_n,z_n))$

给定的训练样本是 $x_1,x_2,...,x_n$ ，样例间独立，我们想找到每个样例隐含的类别 $z$ ，能使得 $p (x, z)$ 最大。 $p (x, z)$ 的最大似然估计如下：
在这里插入图片描述
EM算法的思想是不断建立 $l$ 的下界（E-step），然后优化下界（M-step）。

对于每一个样例 $i$ ，让 $Q_i$ 表示该样例隐含变量 $z$ 的某种分布， $Q i$ 满足

$ΣzQ_i(z)=1,Qi(z)≥0$

得到
在这里插入图片描述
这里运用JENSEN不等式，将(3)看成是 $\theta$ 的函数， $\theta$ 又是模型里的参数，上述过程看成是对 $l(\theta)$ 求下界的过程，所以(3)是参数 $\theta$ 的对数似然函数的下界。

等式成立的条件为：
在这里插入图片描述
$c$ 为常数，不依赖于 $z^i$ 。对此式子做进一步推导，我们知道 $ΣzQ_i(z^i)=1$
则

$Σ_zp(x^i,z^i;θ)=c$

最低0.47元/天解锁文章

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
EM算法实验内容及图片分类任务

EM算法实验内容一、基本原理简介EM算法又称期望最大化算法，是一种迭代算法，是在概率模型中寻找参数极大似然估计的算法，其中概率模型依赖于无法观测的隐含变量。它主要用于从含有隐含变量的数据中计算极大似然估计。是解决存在隐含变量优化问题的有效方法。简单推导1. JENSEN不等式设fff是定义域为实数的函数，如果对于所有的实数xxx，f”(x)≥0f”(x)≥0f”(x)≥0，那么fff是...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。