00-EM算法

最新推荐文章于 2020-09-16 16:54:47 发布

VIP文章 vikYao

最新推荐文章于 2020-09-16 16:54:47 发布

阅读量649

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/victoryaoyu/article/details/71289472

版权

在GMM/HMM（语音识别）训练过程中，需要使用EM算法进行求解模型参数。所以，本文主要推导一下EM算法。即明白什么是期望最大化？

Outline：

极大似然估计（Maximum Likelihood Estimation, MLE）
期望最大化算法（Expectation Maximization, EM）

我们知道如果概率模型的变量都是观测变量，那么给定数据，可以直接用极大似然估计法（MLE），或者贝叶斯估计法来估计模型参数（如：求在校学生身高分布）。然而，当模型中含有隐藏变量时，就不能简单地使用这些估计方法（如：《统计学习方法-李航》中的三硬币模型）。所以，在含有隐变量（Latent Variables）统计模型中，就需要利用EM算法来找到符合观测数据的最大似然的模型参数。

1.极大似然估计（Maximum Likelihood Estimation, MLE）

假如有 $n$ 个独立同分布的观测值 $X=(x_1,x_2,\cdots,x_n)$ ，来自一个未知概率密度函数的分布 $f_0(.|\theta)$ 。问题就是怎么从观测值中求出待估参数 $\theta$ ？显然，这里可以利用一种常用的点估计方法——最大似然估计，求待估参数 $\theta$ 。
所有观测的联合密度函数：

f (x 1, x 2, \dots, x n | θ) = f (x 1 | θ) \times f (x 2 | θ) \times \dots \times f (x n | θ)

$f(x_1,x_2,\cdots,x_n|\theta)=f(x_1|\theta)\times f(x_2|\theta)\times \cdots \times f(x_n|\theta)$

$\theta$ 似然函数：

L (θ; x 1, x 2, \dots, x n) = f (x 1, x 2, \dots, x n | θ) = \prod i = 1 n f (x i | θ) l n L (θ; x 1, x 2, \dots, x n) = \sum i = 1 n l n f (x i | θ)

$L(\theta;x_1,x_2,\cdots,x_n)=f(x_1,x_2,\cdots,x_n|\theta)=\prod_{i=1}^nf(x_i|\theta)\\ lnL(\theta;x_1,x_2,\cdots,x_n)=\sum_{i=1}^nlnf(x_i|\theta)$

极大化似然函数：

θ^= a r g m a x θ l n L (θ; x 1, x 2, \dots, x n)

$\hat{\theta}=\mathop{argmax}_{\theta}lnL(\theta;x_1,x_2,\cdots,x_n)$

得到的 $\hat{\theta}$ 作为 $\theta$ 的极大似然估计，这样我们就求出了模型参数了。

2.期望最大化算法（Expectation Maximization,EM）

然而在一些实际问题中，所要求解的概率模型含有Latent Variable，导致无法利用ML直接计算。（注：下式是向量形式，对向量形式求概率实际上对每一个观测值概率做累乘，

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
00-EM算法

在GMM/HMM（语音识别）训练过程中，需要使用EM算法进行求解模型参数。所以，本文主要推导一下EM算法。即明白什么是期望最大化？
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。