EM算法简单理解

最新推荐文章于 2021-09-05 17:24:35 发布

xmdxcsj

最新推荐文章于 2021-09-05 17:24:35 发布

阅读量2.3k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xmdxcsj/article/details/48809537

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

EM算法是为了解决什么问题？

在求解概率模型的时候，如果需要的变量都是观测变量，不涉及到隐藏变量的话，可以使用极大似然或者贝叶斯估计来求解模型的参数。比如：对于单高斯模型来讲，如果知道观测变量，那么就可以使用极大似然或者最小均方误差来估计高斯模型的均值和方差。

如果模型同时包含观察变量和隐藏变量的话，传统的方法不能完成模型的估计，此时就需要引入EM算法。比如：对于混合高斯模型来讲，除了需要估计高斯模型的均值和方差，还涉及到每个高斯模型的权重信息，这个权重信息就可以认为是隐变量，所以一般使用EM来求解GMM的参数。

EM算法的目标函数

其中Y表示观测变量，Z表示隐含变量。

由于包含隐含变量Z，所以无法正常求解。

EM算法的思想

使用迭代的方法，一步步的求模型参数，使其逐渐逼近于最优，即保证本次的模型参数q_i+1相比上一次的模型参数q_i，使得似然函数的值变大。

为了实现似然函数的递增，基于观察数据Y和本次的模型参数q_i，构造基于未知变量q的Q(q,q_i)函数，作为似然函数L的下限，Q函数最大值对应的q即为本次迭代的模型参数q_i+1。

为什么可以保证Q函数的最大值一定会使得似然函数L的值变大呢？

因为Q有两个性质：一个是作为L的下限，同时还满足在q_i这个点L和Q函数的值是相等的，如果q_i+1满足Q(q_i+1)>=Q(q_i),同时

Q(q_i)==L(q_i)

L(q_i)>=Q(q_i), L(q_i+1)>=Q(q_i+1)

不难推出L(q_i+1)>=L(q_i)，但是无法保证求出的模型参数是全局最优，所以初值的选择非常重要。

EM算法的具体执行

EM算法是expectationmaximization的简称，每次迭代分为两步：

E步，求期望：

即为Q函数

M步，求极大：

求Q函数最大时对应的q作为q_i+1

如果q对应于多组未知变量，分别求导等于0求解

EM算法的应用

1. 非监督学习

对于监督学习，训练数据(x,y)都是已知的，对于非监督学习，只知道输入x，不知道输出y。

可以将输出y作为隐藏变量（未观测数据），EM算法可以学习非监督学习的生成模型。

2. GMM训练

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄16年

132
原创

314
点赞

941
收藏

818
粉丝

关注

私信

热门文章

分类专栏

python 2篇
工具 7篇
sphinx 3篇
linux相关 3篇
机器学习 10篇
杂谈 3篇
htk 8篇
android 2篇
语音识别 10篇
mapreduce
神经网络 21篇
torch 8篇
gpu 3篇
语言模型 7篇
theano 1篇
audio
kaldi 15篇
声学模型 20篇
c/c++ 2篇
线性代数库 4篇
语音合成 5篇

最新评论

自监督预训练（三）wav2vec 2.0原理剖析
wust不吃洋葱: 请问feature encoder最后两层cnn的输出为什么不是(x-80)/160和(x-80)/320呢？
CTC学习笔记（一）简介
凯尔哥: 我真的是没搞明白，为什么这篇博客会有这么高的阅读量
CTC学习笔记（四）解码-WFST
魔法学徒q: 大佬您好，因为看您分享过几篇语音识别中使用wfst的论文，想到您应该对wfst比较了解。目前我用wenet做训练识别一个官方以外的数据集时，我是使用该数据集语料库和librispeech的lexicon做的lm解码，但是我发现解码结果是把所有音频都识别成了一个单词yeah。请问我是需要重新构建lexicon，还是可能其他地方出错了呢？
CTC学习笔记（二）训练和公式推导
treeswolf: 这篇博客，最后导softmax前的输出的推导是最清楚的了，其它篇都没有，泛泛而谈。
自监督预训练（二）语音部分
小方abc: 工作了还有时间看这么多论文吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。