统计学习方法-EM算法-读书笔记

最新推荐文章于 2020-11-19 09:28:47 发布

qq_38829768

最新推荐文章于 2020-11-19 09:28:47 发布

阅读量311

点赞数

分类专栏：学习笔记文章标签：统计学习方法机器学习 EM算法

本文链接：https://blog.csdn.net/qq_38829768/article/details/103049659

版权

学习笔记专栏收录该内容

17 篇文章 0 订阅

订阅专栏

EM算法是一种迭代方法，用于含有隐变量的概率模型参数估计。算法包括E步（期望）和M步（极大化），在高斯混合模型（GMM）中应用广泛。GMM是概率分布模型，由多个高斯分布组成，常用于非监督学习。

摘要由CSDN通过智能技术生成

统计学习方法-EM算法-读书笔记

1、前言

EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。每次迭代由两部分组成：E步，求期望；M步，求极大值，直至收敛。
隐变量:不能被直接观察到，但是对系统的状态和能观察到的输出存在影响的一种变量。

2、EM算法

(1)选择参数的初始值 $\theta(0)$ ,开始迭代，注意EM算法对初值敏感。
(2)E步： $\theta(i)$ 为第i次迭代参数 $\theta$ 的估计值，在第i+1次迭代的E步，计算
$Q(\theta,{\theta}^{(i)})=E_z[\log P(Y,Z|\theta)|Y,{\theta}^{(i)}]=\sum_z{logP(Y,Z|\theta)P(Z|Y,{\theta}^{(i)})}$
$P(Z|Y,\theta)$ 是在给定观测数据Y和当前参数估计 $\theta$ 下隐变量数据Z的条件概率分布。
(3)M步：求使 $Q(\theta,{\theta}^{(i)})$ 极大化的 $\theta$ ，确定第i+1次迭代的参数的估计值
${\theta}^{(i+1)}=arg maxQ(\theta,{\theta}^{(i)})$
重复2，3步，直到收敛，一般是对较小的正数满足 $||\theta 1-\theta 2||<\xi$
EM算法是通过不断求解下界的极大化逼近求解对数似然函数极大化的算法。可以用于生成模型的非监督学习，生成模型由联合概率分布P(X,Y)表示，X为观测数据，Y为未观测数据。

3、高斯混合模型(GMM)

高斯混合模型是指具有如下形式的概率分布模型：
$P(y|\theta)=\sum_{k=1}^K{{\alpha}_k \phi(y|{\theta})}$
其中第一个是系数，第二个是高斯分布密度
${\phi}(y|{\theta}_k)=\frac{1}{(2\pi)^{1/2}{\sigma}_k}exp(-\frac{(y-{\mu}_k)^2}{2{\sigma}_k^2})$
称为第k个分模型。在这里插入图片描述

qq_38829768

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-EM算法-读书笔记

统计学习方法-EM算法-读书笔记1、前言2、EM算法3、高斯混合模型(GMM)1、前言EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。每次迭代由两部分组成：E步，求期望；M步，求极大值，直至收敛。隐变量:不能被直接观察到，但是对系统的状态和能观察到的输出存在影响的一种变量。2、EM算法(1)选择参数的初始值θ(0)\theta(0)θ(0),开始迭...
复制链接

扫一扫

专栏目录