EM算法-学习笔记

最新推荐文章于 2024-10-12 16:55:46 发布

songwzup

最新推荐文章于 2024-10-12 16:55:46 发布

阅读量442

点赞数

分类专栏：机器学习基本算法文章标签：机器学习 EM算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songwzup/article/details/44860053

版权

机器学习基本算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

历史：1977，Dempster等人提出

适用：含有隐变量的概率模型的参数推断，即对于P(Y,Z|θ)，其中Y已知，θ和Z未知，求θ。

缺点：与初值的选择有关；不能保证求得全局最优解。

引子

若概率模型只有观测变量，那么直接可以用最大似然、贝叶斯估计估计参数。

而对于带有隐变量的模型参数，不可使用以上方法。

算法：

初始化θ(0);

until 参数收敛（如，参数变化不大）：

E步：

求Q函数：Q(θ,θ(i))=

M步：

求使Q函数取极大值的参数θ作为i+1，即θ(i+1)=argmaxQ(θ,θ(i))

end

理解

1，算法的核心在于Q函数的理解。

2，对于Q函数：

（1）θ是未知的参数，θ(i)是已知的迭代参数集合，初始为θ(0)，Y为观测量，Z为隐含量。

（2）Q函数等于已知θ(i)和观测量Y后隐含量Z的期望。

（3）对于Q函数的导出，参见统计学习方法的159页。

目标是极大化L(θ)

而B函数是L(θ)的一个下界，即L(θ)>=B(θ,θ(i))

找到使B函数取极大值的θ作为新的θ(i)即θ(i+1)，可使L(θ)也增大。

求argmaxB(θ,θ(i))去掉常数项（带θ(i)的和项）就等于argmaxQ(θ,θ(i))。

以下摘自

PRML读书会第九章 Mixture Models and EM（Kmeans，混合高斯模型，Expectation Maximization）

是我们的目标函数，加入隐藏变量可以写成这种形式：

先初始化模型的参数，由于隐变量无法观测到，我们用参数来得到它的后验

然后呢，我们通过隐藏变量的期望得到新的完整数据的最大似然函数：

以上是E步，M步是求这个似然函数的Q函数的最优解，也就是新的参数：

注意这个Q函数是包含隐变量的完整数据的似然函数

关于收敛

可以规定参数变化不大之后即为收敛。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

songwzup CSDN认证博客专家 CSDN认证企业博客

码龄12年

10: 原创

63万+: 周排名

69万+: 总排名

1万+: 访问

: 等级

380: 积分

1: 粉丝

1: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

scipy.sparse中csc/csr矩阵的解释
qq_32088207: 评论的这个跟官网的例子一样的，应该以这个为准。 indptr[1]:indptr[2]=[2] 这里我不懂，不是 indptr[1]:indptr[2]=[2，3] indices[2,3] = [2,0] data[2,3] = [3,4]吗，怎么知道第三行有三个数但是第二行只有一个的。
scipy.sparse中csc/csr矩阵的解释
小矮之: 兄弟，你这个输出矩阵不对 Google translate：行i的列索引存储在索引[indptr [i]：indptr [i + 1]]中，并将其相应的值存储在数据[indptr [i]：indptr [i + 1]]中）结论：所以其中indices[indptr[0]:indptr[2]]对应indices[0:1]==([0,2])，指的的是0行的0列和2列，填充数据为data[0:1]==['1','2']。也就是第一行的第一列和第三列为1和2 官网：https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_matrix.html 输出： array([[1, 0, 2], [0, 0, 3], [4, 5, 6]])
给Code::Blocks配置gsl——lda源码和ctr源码windows下的编译过程
数据挖掘算法喵: 请问一下ctr的代码怎么使用呢？我用lda得到theta和beta当做initial输入到ctr里面，最后得到了finalU,finalV,finalBeta,finalTheta, 我用finalU与finalTheta相乘来做out of matrix 的预测，但是结果很不理想。请问我的操作是正确的吗？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。