EM算法参考CMU讲义

VIP文章 Petersburg

已于 2022-11-12 15:03:18 修改

阅读量599

点赞数

文章标签：算法人工智能

于 2022-11-11 21:09:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Petersburg/article/details/127812292

版权

什么是EM算法

EM算法属于似然思想下，对于模型参数更新的方法。具体而言，我们以神经网络为例，我们记这个神经网络的所有参数为 $\theta$ ，可以观测到的因变量为 $y$ ，不可观测的因素（隐变量）记为 $x$ 。通过EM算法，我们可以将参数 $\theta$ 更新到使得可观测变量 $y$ 的log likelihood变得最大，或者说最贴合我们的数据分布。

问题描述与化简

我们要优化的函数是：
$\mathcal{L}(\theta) = \log p(y|\theta)$
但是这个函数我们不太好操作，我们对它做一个变换
$\begin{aligned} \mathcal{L}(\theta) & =\log \int p(x,y|\theta)dx \\ \end{aligned}$
对于任意一个 $x$ 的分布 $q (x)$ ，我们将上式转化为
$\begin{aligned} \mathcal{L}(\theta)=\log \int q(x) \frac{p(x,y|\theta)}{q(x)}dx \end{aligned}$
通过Jensen不等式，我们有关系：
$\begin{aligned} \mathcal{L}(\theta)=&\log \int q(x) \frac{p(x,y|\theta)}{q(x)}dx \\ \leq& \int q(x)\log \frac{p(x,y|\theta)}{q(x)}dx \triangleq \mathcal{F}(q(x),\theta) \end{aligned}$
这里我们得到的 $\mathcal{F}(q(x), \theta)$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
EM算法参考CMU讲义

对于EM算法从零开始的介绍与详细证明
复制链接

扫一扫

博客等级

码龄5年

43
原创

58
点赞

143
收藏

16
粉丝

关注

私信

热门文章

分类专栏

pytorch 10篇
python 6篇
调参 1篇
Attention 2篇
文本分析 3篇
sklearn 1篇
scipy学习 1篇
python问题集锦 3篇

最新评论

【情感分析 PyTorch】RNN于IMDB数据集上的表示
Guan_God: 博主，最后的测试是怎样进行的
级数收敛、cesaro可和以及Abel可和的关系
♚放晴♛~: 这整个证明似乎有一些问题。你要得到推论一，重要的前提是S_n的发散速度要比r^n的收敛速度慢，或者最简单的假设S存在。但是你在后面的证明中只是假设了其Cesaro和存在，所以并不能直接使用推论。或者是我有哪里考虑不周的地方。请指教。
【selenium (chrome) + python】n级引用/被引用文献爬取 & 爬虫库介绍
Petersburg: 感谢催更hhhh，我整理一下发上来，内容比较多
粒子群算法 PSO 讲解 + python源码
Petersburg: 这个是我参照一个视频的讲解复现的
【PyTorch 计算图】requires_grad=True的leaf variable及其设计逻辑
Petersburg: 这种需要梯度的参数基本都是模型内部的参数，比如一个矩阵，或者一个RNN的参数，这些都是不需要手动设定的，直接调用已有的东西就好，我们在日常使用中是不应该去积极创建具有梯度的东西的，这些在逻辑上应该只在计算的时候或者模型内部存在

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。