第33课：EM算法——估计含有隐变量的概率模型的参数

最新推荐文章于 2022-02-14 21:57:09 发布

叶锦鲤

最新推荐文章于 2022-02-14 21:57:09 发布

阅读量851

点赞数

分类专栏：机器学习极简入门文章标签：精品课人工智能机器学习榜单

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YeJuliaLi/article/details/108729582

版权

EM算法是一种用于含有隐变量的概率模型参数估计的迭代方法。在无法直接最大化对数似然函数时，通过近似极大化的方式逐步优化参数。算法包括E步（期望）和M步（最大化），在E步中计算隐变量的期望，M步中最大化该期望以更新参数。通过不断迭代，最终得到模型参数的估计值。

摘要由CSDN通过智能技术生成

含有隐变量的概率模型

通过极大化对数似然函数求解概率模型参数

设有概率模型，${X}$ 表示其样本变量，$\Theta$ 表示其参数。

我们知道这个概率模型的形式，又有很多的样本数据（$X$ 取值已知），但是却不知道概率模型的具体参数值（$\Theta$ 取值未知）。有没有办法求出 $\Theta$ 的取值呢？

早在学习朴素贝叶斯模型的时候，我们就知道：当一个概率模型参数未知，但有一系列样本数据时，可以采用极大似然估计法来估计它的参数。

该概率模型的学习目标是极大化其对数似然函数：

$LL(\Theta|X) = \log{P(X | \Theta)}$

此时，根据 $X$ 直接极大化 $LL(\Theta|X) $ 来求 $\Theta$ 的最优取值即可。

此处的 $X$ 必须是完全数据——也就是样本数据的所有变量的值都是可见且完整的情况下，才可以通过直接极大化对数似然函数来求解参数的值。

含有隐变量的对数似然函数

有的时候，概率模型既含有可以看得见取值的观测变量，又含有直接看不到的隐变量（Hidden Variable，又称潜在变量 Latent Variable）。

设有概率模型，${X}$ 表示其观

了解本专栏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

叶锦鲤 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。