机器学习之EM算法

最新推荐文章于 2024-01-26 17:25:22 发布

年少无为呀！

最新推荐文章于 2024-01-26 17:25:22 发布

阅读量349

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_19409845/article/details/103882682

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章目录

EM具体的含义是什么？

EM算法(Expectation Maximization Algorithm, 最大期望算法)是一种迭代类型的算法，是一种在概率模型中寻找参数最大似然估计或者最大后验估计的算法，其中概率模型依赖于无法观测的隐藏变量。
EM算法流程：
- 初始化分布参数/模型参数
- 重复下列两个操作直到收敛：
  - E步骤：估计隐藏变量的概率分布期望函数；
  - M步骤：根据期望函数重新估计分布参数。

Jensen不等式

在这里插入图片描述

如果函数f为凸函数，那么存在下列公式：
$f(\theta x+(1-\theta)y)\leq\theta f(x)+(1-\theta)f(y)$
若 $θ_1,...,θ_k≥0，θ_1+....+θ_k=1;$ 则
$f(\theta_1x_1+...+\theta_kx_k)\leq\theta_1f(x_1)+...+\theta_kf(x_k)$ $f(E(x))\leq E(f(x))$

算法原理

给定的m个训练样本 ${x^{(1)},x^{(2)},...,x^{(m)}}$ ，样本间独立，找出样本的模型参数θ，极大化模型分布的对数似然函数如下：
$\theta=\argmax_\theta \sum^m_{i=1}\log(P(x^{(i)};\theta))$
假定样本数据中存在隐含数据 ${z^{(1)},z^{(2)},...,z^{(k)}}$ ，此时极大化模型分布的对数似然函数如下：
$\begin{aligned}\theta &=\argmax_\theta\sum^m_{i=1}\log(P(x^{(i)};\theta))\\ &=\argmax_\theta\sum^m_{i=1}\log\left(\sum_{z^{(i)}}P(z^{(i)})P(x^{(i)}|z^{(i)};\theta)\right)\\ &=\argmax_\theta\sum^m_{i=1}\log\left(\sum_{z^{(i)}}P(x^{(i)},z^{(i)};\theta)\right) \end{aligned}$
令z的分布为Q(z;θ) ，并且Q(z;θ)≥0；
$\sum_z=Q(z;\theta)=1$
那么有如下公式：
$\begin{aligned}l(\theta) &=\sum_{i=1}^m\log\sum_zp(x,z;\theta)\\ &=\sum^m_{i=1}\log\sum_zQ(z;\theta^{old})\cdot\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\\ &=\sum_{i=1}^m\log\left(E_Q\left(\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\right)\right)\geq\sum_{i=1}^mE_Q\left(\log\left(\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\right)\right)\\ & = \sum^m_{i=1}\sum_zQ(z;\theta^{old})\log\left(\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\right) \end{aligned}$
根据Jensen不等式的特性，当下列式子的值为常数的时候，l(θ)函数才能取等号。

$l(\theta)\geq\sum^m_{i=1}\sum_zQ(z;\theta^{old})\log\left(\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\right)$
$\frac{p(x,z;\theta^{old})}{Q(z;\theta^{old})}=c,\forall x,\forall z$
$\begin{aligned}Q(z;\theta^{old})&=\frac{p(x,z;\theta^{old})}{c}=\frac{p(x,z;\theta^{old})}{c\cdot\sum_{z^{i}}Q(z^i;\theta^{old})}\\& =\frac{p(x,z;\theta^{old})}{\sum_{z^{i}}c\cdot Q(z^i;\theta^{old})}=\frac{p(x,z;\theta^{old})}{\sum_{z^{i}}p(x,z^i;\theta^{old})}\\&=\frac{p(x,z;\theta^{old})}{p(x;\theta^{old})}=p(z|x;\theta^{old})\end{aligned}$

$\begin{aligned}\theta&=\argmax_{\theta}l(\theta)=\argmax_\theta \sum^m_{i=1}\sum_zQ(z;\theta^{old})\log\left(\frac{p(x,z;\theta)}{Q(z;\theta^{old})}\right)\\&=\argmax_\theta\sum^m_{i=1}\sum_zp(z|x;\theta^{old})\log\left(\frac{p(x,z;\theta)}{p(z|x;\theta^{old})}\right)\\&≌\argmax_\theta\sum^m_{i=1}\sum_zp(z|x;\theta^{old})\log(p(x,z;\theta)) \end{aligned}$

EM算法流程

条件：样本数据 $x={x^1,x^2,...,x^m}$ ，联合分布 $p(x,z;\theta)$ ，条件分布 $p(x,z;\theta)$ ，最大迭代次数J
- 随机初始化模型参数 $\theta$ 的初始值 $\theta^0$
- 开始EM算法的迭代处理：
  - E步：计算联合分布的条件概率期望
    $Q^j=p(z|x;\theta^j)$ $l(\theta)=\sum_{i=1}^m\sum_zQ^j\log(p(z,x;\theta))$
  - M步：极大化L函数，得到 $\theta^{j+1}$
    $\theta^{j+1}=\argmax_\theta l(\theta)$
  - 如果θj+1已经收敛，则算法结束，输出最终的模型参数θ，否则继续

EM算法收敛证明 在这里插入图片描述

GMM

GMM(Gaussian Mixture Model, 高斯混合模型)是指该算法由多个高斯模型线性叠加混合而成。每个高斯模型称之为component。GMM算法描述的是数据的本身存在的一种分布。
GMM算法常用于聚类应用中，component的个数就可以认为是类别的数量。
假定GMM由k个Gaussian分布线性叠加而成，那么概率密度函数如下：

$p(x)=\sum^K_{k=1}p(k)p(x|k)=\sum^K_{k=1}\pi_kp(x;\mu_k,\sum_k)$
对数似然函数
$l(\pi,\mu,\sum)=\sum^N_{i=1}\log\left(\sum_{i=1}^K\pi_kp(x^i;\mu_k,\sum_k)\right)$
在这里插入图片描述

年少无为呀！

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习之EM算法

文章目录EM具体的含义是什么？EM具体的含义是什么？EM算法(Expectation Maximization Algorithm, 最大期望算法)是一种迭代类型的算法，是一种在概率模型中寻找参数最大似然估计或者最大后验估计的算法，其中概率模型依赖于无法观测的隐藏变量。EM算法流程：初始化分布参数/模型参数重复下列两个操作直到收敛：E步骤：估计隐藏变量的概率分布期望函数；M步骤...
复制链接

扫一扫