[Deeplearning]能量模型(EBM)

最新推荐文章于 2023-06-09 18:34:55 发布

风澈云间

最新推荐文章于 2023-06-09 18:34:55 发布

阅读量8.6k

点赞数 3

分类专栏：深度学习文章标签： Deeplearni

深度学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

本篇博客是对基于能量的模型和波尔兹曼机学习的总结。

1. 基于能量的模型(EBM)

基于能量的模型主要有两个任务，一个是推断(Inference)，在给定观察变量的情况下，找到使能量值最小的那些隐变量的配置。另一个是学习(Learning),寻找一个恰当的能量函数，使得观察变量的能量比隐变量的能量低。
基于能量的概率模型通过一个能量函数来定义概率分布。
$p(x)=\frac {e^{-E(x)}} Z ...(1)$
其中Z为规规整因子.
$Z=\sum_x e^{-E(x)} ...(2)$
基于能量的模型可以利用梯度下降过随机梯度下降的方法来学习。比如使用负对数作为损失函数。
$l(\theta,D)=-L(\theta,D)=- \frac 1N \sum_{{x^{(i)}}\in D}log p(x^{(i)}) ...(3)$
其中 $\theta$ 为模型参数。对损失函数求偏导得到
$\Delta=\frac {\partial {l(\theta,D)} }{\partial \theta} =- \frac 1N \frac {\partial {\sum log p(x^{(i)})}}{\partial \theta}$

2. 包含隐单元的EBM

很多情况下我们无法观察到样本所有属性，或者我们需要引进一些没有观察到的变量，来增加表达能力。这样就得到包含隐含变量的EBM
$P(x)=\sum_h P(x,h) = \sum_h \frac {e^{-E(x,h)}} Z$
其中 $h$ 表示隐藏变量。
为了模型统一，引入自由能量函数，
$F(x)=-log \sum_h e^{-E(x,h)}$ ,
$P(x)$ 可以写成
$P(x)=\frac {e^{-F(x)}}Z$
梯度下降为
$\Delta=- \frac {\partial log p(x)}{\partial \theta}=- \frac {\partial (-F(x)- log Z)}{\partial \theta}=\frac {\partial F(x)}{\partial \theta} - \sum_{\widehat{x}}p (\widehat{x})\frac {\partial F(\widehat x)}{\partial \theta}$