机器学习笔记之受限玻尔兹曼机(二)模型表示

静静的喝酒

已于 2022-12-07 17:05:05 修改

阅读量912

点赞数

分类专栏：机器学习文章标签：受限玻尔兹曼机玻尔兹曼机的缺陷 Learning问题因子图

于 2022-12-03 15:07:20 首次发布

本文链接：https://blog.csdn.net/qq_34758157/article/details/128157503

版权

机器学习笔记之受限玻尔兹曼机——模型表示

引言

引言

上一节基于马尔可夫随机场介绍了玻尔兹曼分布，本节将介绍受限玻尔兹曼机的模型表示(Representation)。

回顾：玻尔兹曼分布

基于Hammersley-Clifford定理，可以将马尔可夫随机场 $\mathcal G$ 中关于随机变量集合的联合概率分布 $\mathcal P(\mathcal X)$ 表示为如下形式：
$\mathcal P(\mathcal X) = \frac{1}{\mathcal Z} \prod_{i=1}^{\mathcal K} \psi_i(x_{\mathcal C_i})$
其中 $x_{\mathcal C_i}(i=1,2,\cdots,\mathcal K)$ 表示极大团 $\mathcal C_i$ 中结点组成的随机变量集合； $\psi_i(x_{\mathcal C_i})$ 表示极大团 $x_{\mathcal C_i}$ 对应的势函数； $\mathcal Z$ 表示规范化因子。
由于势函数的恒正属性，因此通常将势函数使用能量函数进行表示：
$\psi_i(x_{\mathcal C_i}) = \exp \left\{-\mathbb E[x_{\mathcal C_i}]\right \} \quad i=1,2,\cdots,\mathcal K$
那么 基于能量函数表示的联合概率分布 $\mathcal P(\mathcal X)$ 被称作吉布斯分布，也称玻尔兹曼分布：
这里全部使用’玻尔兹曼分布‘进行描述。
$\begin{aligned} \mathcal P(\mathcal X) & = \frac{1}{\mathcal Z} \prod_{i=1}^{\mathcal K} \exp \left\{- \mathbb E[x_{\mathcal C_i}]\right\} \\ & = \frac{1}{\mathcal Z} \exp \left[- \sum_{i=1}^{\mathcal K} \mathbb E[x_{\mathcal C_i}]\right] \end{aligned}$

此时的联合概率分布 $\mathcal P(\mathcal X)$ 明显是指数族分布的表示形式。
可以将 $-\sum_{i=1}^{\mathcal K} \mathbb E[x_{\mathcal C_i}]$ 看作是’某权重矩阵‘ $\mathcal W$ 与’极大团向量‘ $x_{\mathcal C} = (x_{\mathcal C_1},x_{\mathcal C_2},\cdots,x_{\mathcal C_{\mathcal K}})^T$ 的线性组合。
$\frac{1}{\mathcal Z} \exp \left[- \sum_{i=1}^{\mathcal K} \mathbb E[x_{\mathcal C_i}]\right] \Rightarrow \frac{1}{\mathcal Z} \exp [\mathcal W^T x_{\mathcal C}]$