机器学习-白板推导系列笔记（二十一）-RBM

最新推荐文章于 2024-07-16 17:56:45 发布

及时行樂_

最新推荐文章于 2024-07-16 17:56:45 发布

阅读量710

点赞数 2

分类专栏：哔站机器学习白板推导文章标签：机器学习

本文链接：https://blog.csdn.net/qq_41485273/article/details/112172418

版权

本文详细介绍了受限玻尔兹曼机（RBM）的背景、模型表示和推断。RBM是一种特殊的马尔科夫随机场，采用玻尔兹曼分布。文章通过因子分解解释了玻尔兹曼机的概率分布，并阐述了RBM如何简化Boltzmann机的推断问题，以及与其他概率图模型如Naive Bayes、GMM和CRF的区别。同时，文章还探讨了RBM的后验概率计算和边缘概率的推导过程。

摘要由CSDN通过智能技术生成

此文章主要是结合哔站shuhuai008大佬的白板推导视频：受限玻尔兹曼机_155min

全部笔记的汇总贴：机器学习-白板推导系列笔记

玻尔兹曼机介绍：白板推导系列笔记（二十八）-玻尔兹曼机

一、背景介绍

RBM（Restricted Boltzmann Machine）

（一）玻尔兹曼机

玻尔兹曼机（Boltzmann Machine）可以说它就是一个马尔科夫随机场（Markov Random Field），简单来说就是一个无向图模型，是一种随机神经网络，借鉴了模拟退火思想，因为使用了玻尔兹曼分布作为激活函数，所以称为玻尔兹曼机。

如下图所示，将无向图中的节点分为两类，阴影的节点为Observed Variable（用 $v$ 表示），另一类为Hidden Variable（用 $h$ 表示）
在这里插入图片描述

（二）因子分解

既然说玻尔兹曼机是一种特殊的马尔科夫随机场，我们首先回顾一下马尔科夫随机场的因子分解。

马尔科夫随机场的因子分解是基于最大团的，其中：

$C_i:最大团，\psi_i(x_{ci}):势函数（potential\;function） Z:归一化因子（配分函数partition\;function）$
$P(x)=\frac1Z\prod^K_{i=1}\psi_i(x_{ci})$ $S.t.:\psi_i严格大于0\\Z=\sum_x\prod^K_{i=1}\psi_i(x_{ci})=\sum_{x_1}\sum_{x_2}\cdots\sum_{x_p}\prod^K_{i=1}\psi_i(x_{ci})$
$因为\psi_i严格大于0，所以我们取\psi_i(x_{ci})=\exp\{-E(x_{ci})\}，其中E为能量函数（Energy\;Function）$
所以， $P(x)=\frac1Z\prod^K_{i=1}\psi_i(x_{ci})=\underset{指数族分布}{\underbrace{\frac1Z\exp\{-\sum^K_{i=1}E(x_{ci})\}}}$

所以，我们将最大团结合到 $x$ 中去，可以得到， $P(x)=\frac1Z\exp\{-E(x_{})\}$
这就是玻尔兹曼分布（Boltzmann Distribution）或者吉布斯分布（Gibbs Distribution）

（三）玻尔兹曼分布

这是一个统计物理学的概念，是一个物理系统，具体可以看看视频的讲解，这篇文章也可以看看：玻尔兹曼机。

二、模型表示

（一）RBM的模型推导

对于 $x$ ，我们可以令 $x=(x_1,x_2,\cdots,x_p)^T$ ，也可以将 $x$ 分为隐变量和观测变量两部分，即 $x=\left(\begin{matrix} h\\v\end{matrix}\right )$ ，其中，

$h=(h_1,h_2,\cdots,h_m)^T\\v=(v_1,v_2,\cdots,v_p)^T\\m+n=p$

在这里插入图片描述
Boltzmann machine的问题：Inference。精确推断几乎不可能，近似推断计算量过大。因此需要对这个模型进行简化，也就引出了受限玻尔兹曼机（Restricted Boltzmann Machine），即只在 $h, v$ 之间有连接， $h, v$ 内部无连接。
在这里插入图片描述

所以， $P(x)=\frac1Z\exp\{-E(x_{})\}$ 可以化为：

$P(v,h)=\frac1Z\exp\{-E(v,h)\}$

我们假设 $E(v,h)=-(h^Twv+\alpha^T v+\beta^T h)$ ，所以，

$P(v,h)=\frac1Z\exp\{h^Twv+\alpha^T v+\beta^T h\}\\=\frac1Z\exp\{h^Twv\}\cdot\exp\{\alpha^T v\}\cdot\exp\{\beta^T h\}$

可以参考白板推导系列笔记（九）-概率图模型中的因子图（factor graph view），可以发现上式中的每一项都对应一个因子。
在这里插入图片描述
所以，RBM的pdf为：

$P(v,h)=\frac1Z\exp(h^Twv)\cdot\exp(\alpha^T v)\cdot\exp(\beta^T h)\\=\frac1Z\underset{factor}{\underbrace{\underset{edge}{\underbrace{\prod^m_{i=1}\prod^n_{j=1}\exp(h_iw_{ij}v_j)}}\underset{node\;v}{\underbrace{\prod^n_{j=1}\exp(\alpha_jv_j)}}\underset{node\;h}{\underbrace{\prod^m_{i=1}\exp(\beta_ih_i)}}}}\\其中，w,\alpha,\beta均为参数$