Andrew Ng机器学习课程笔记（十五）之无监督学习之混合贝叶斯模型与EM算法

最新推荐文章于 2023-10-08 16:29:00 发布

danerli

最新推荐文章于 2023-10-08 16:29:00 发布

阅读量4.2k

点赞数 3

分类专栏：机器学习人工智能机器学习——基础篇

本文链接：https://blog.csdn.net/danerer/article/details/80282798

版权

机器学习同时被 3 个专栏收录

21 篇文章 2 订阅

订阅专栏

机器学习——基础篇

19 篇文章 1 订阅

订阅专栏

人工智能

17 篇文章 0 订阅

订阅专栏

文章目录

@[toc] Preface
Mixture of Naive Bayes Model
EM Algorithm for NBMM
EM Algorithm for NBMM

Preface

Mixture of Naive Bayes Model（NBMM，混合朴素贝叶斯模型）
EM Algorithm for NBMM

Bernoulli

Mixture of Naive Bayes Model

NBMM是对朴素贝叶斯（Naive Bayes，NB，前面有一篇博文介绍）的一个推广。
回想到我们在那一篇博文中所讲述的文本分类的例子，即对于大小为m数据集 $\{x^{(1)},x^{(2)},...,x^{(m)}\},x^{(i)}\in\{0,1\}^n$ ，例如 $x_j^{(i)}$ 表示词语j是否在文档i中出现，然后我们对于 $z^{(i)}$ 建模，希望找到当前邮件是否为垃圾邮件。
对于混合朴素贝叶斯模型，我们需要对大小为m无标记数据集 $\{x^{(1)},x^{(2)},...,x^{(m)}\},x^{(i)}\in\{0,1\}^n$ 进行处理分类，我们隐含类别标签用 $z^{(i)}$ 表示，并认为 $z^{(i)}$ 服从参数为 $\phi$ 的伯努利分布，即为 $z^{(i)}\sim Bernoulli(\phi)$ ，且 $z\in\{0,1\}$ 。
同时， $p(x^{(i)}|z^{(i)})=\prod_{j=1}^n p(x_j^{(i)}|z^{(i)})$ ，具体的有 $p(x_j^{(i)}=1|z^{(i)}=0)=\phi_{j|z^{(i)}=0}$ 。
整个模型简单描述为对于每个样例 $x^{(i)}$ ，我们先从k 个类别中按多项式分布抽取一个 $z^{(i)}$ ，然后根据 $z^{(i)}$ 所对应的 k 个多值伯努利分布中的一个生成样例 $x^{(i)}$ ，。整个过程称作混合伯努利模型。
它的joint似然函数为：
$\begin{aligned} L(\phi_{z},\phi_{j|z^{(i)}=1},\phi_{j|z^{(i)}=0})&=\underset{i=1}{\overset{m}{\prod}}log\; p(x^{(i)},y^{(i)}) \end{aligned}$
由于 $z^{(i)}$ 未知，上式我们无法使用求偏导，并令其等于0求得 $\phi_{z},\phi_{j|z^{(i)}=1},\phi_{j|z^{(i)}=0}$ 参数。与GMM一样，我们使用EM算法来解决问题。

EM Algorithm for NBMM

回顾我们在上上一篇博文中提到的EM算法

Repeat until convergence{

(E-step) for each i, set
$\begin{aligned} w_j^{(i)}:=Q_{i}(z^{(i)}=j):=p(z^{(i)}=j|x^{(i)};\theta) \end{aligned}$
(M-step) set
$\begin{aligned}\theta:=\text{arg}\;\;\underset{\theta}{\text{max}}\;\;\underset{i}{\sum}\underset{z^{(i)}}{\sum}Q_{i}(z^{(i)})log\frac{p(x^{(i)},z^{(i)};\theta)}{Q_{i}(z^{(i)})} \end{aligned}$
｝

使用NBMM中的 $\phi_{z},\phi_{j|z^{(i)}=1},\phi_{j|z^{(i)}=0}$ 参数替换一般化EM算法中的 $\theta$ 参数，然后在依次解决 $w_j^{(i)}$ 与 $\phi_{z},\phi_{j|z^{(i)}=1},\phi_{j|z^{(i)}=0}$ 参数的更新问题就好。

由于在上一篇博文Andrew Ng机器学习课程笔记（十四）之无监督学习之混合高斯模型与EM算法中我们已经详细推导过一遍EM算法在GMM中的具体化过程（在NBMM中推导过程相似，就不在重复了），这里我们直接给出NBMM的EM算法。

EM Algorithm for NBMM

将其具体应用到NBMM中就变成了：

EM Algorithm for NBMM的E-step与M-step为：

Repeat until convergence{

(E-step) for each i, set
$\begin{aligned} w_j^{(i)}=P(z^{(i)}=1|x^{(i)};\phi_{z},\phi_{j|z^{(i)}=1},\phi_{j|z^{(i)}=0}) \end{aligned}$
表示的含义为这是对当前文档属于哪一类的猜测。
(M-step) set

$\begin{aligned} \phi_{j|z^{(i)}=1}:=\frac{\sum_{i=1}^{m}w^{(i)}\;1\{x_j^{(i)}=1\}}{\sum_{i=1}^{m}w^{(i)}} \end{aligned}$

$\begin{aligned} \phi_{j|z^{(i)}=0}:=\frac{\sum_{i=1}^{m}(1-w^{(i)})\;1\{x_j^{(i)}=1\}}{\sum_{i=1}^{m}(1-w^{(i)})} \end{aligned}$

$\begin{aligned} \phi_{z^{(i)}}:=\frac{\sum_{i=1}^{m}w^{(i)}}{m} \end{aligned}$

｝

danerli

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
6
评论
Andrew Ng机器学习课程笔记（十五）之无监督学习之混合贝叶斯模型与EM算法

PrefaceJensen’s InequalityExpectation-Maximization AlgorithmPrefaceJensen’s Inequality（Jensen不等式） Expectation-Maximization Algorithm（EM算法）Jensen’s InequalityExpectation-Maximizati...
复制链接

扫一扫