DBN的浅显易懂解释

最新推荐文章于 2024-09-09 10:44:41 发布

不吃香菇666

最新推荐文章于 2024-09-09 10:44:41 发布

阅读量4.1k

点赞数 1

分类专栏：深度学习

深度学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

转载自：http://blog.163.com/silence_ellen/blog/static/176104222201431710264087/

本篇非常简要地介绍了深度信念网络的基本概念。文章先简要介绍了深度信念网络（包括其应用实例）。接着分别讲述了：(1) 其基本组成结构——受限玻尔兹曼机的的基本情况，以及，(2) 这个基本结构如何组成深度信念网络。本文仅仅能使读者了解深度信念网络这一概念，内容非常浅显，甚至有许多不严密的地方。如果有愿意深入了解受限玻尔兹曼机、深度信念网络的，想对深度学习有更多了解的，请访问深度学习官方网站。或者读者可以参考文末的“推荐阅读”一节。

概述 .............................................................................................................................. 2

受限玻尔兹曼机 ............................................................................................................ 3

神经元之间的条件独立性 .......................................................................................... 3

使用 RBM 的过程 ..................................................................................................... 4

训练 RBM ................................................................................................................. 5

深度信念网络 ................................................................................................................ 5

训练过程： ................................................................................................................ 6

调优过程 (Fine-Tuning) ： ...................................................................................... 6

使用过程 ................................................................................................................... 7

推荐阅读 ....................................................................................................................... 8

论文 .......................................................................................................................... 8

博文和网络教程 ........................................................................................................ 8

概述

深度信念网络 (Deep Belief Network, DBN) 由 Geoffrey Hinton 在 2006 年提出。它是一种生成模型，通过训练其神经元间的权重，我们可以让整个神经网络按照最大概率来生成训练数据。我们不仅可以使用 DBN 识别特征、分类数据，还可以用它来生成数据。下面的图片展示的是用 DBN 识别手写数字：

图 1 用深度信念网络识别手写数字。图中右下角是待识别数字的黑白位图，它的上方有三层隐性神经元。每一个黑色矩形代表一层神经元，白点代表处于开启状态的神经元，黑色代表处于关闭状态的神经元。注意顶层神经元的左下方即使别结果，与画面左上角的对应表比对，得知这个 DBN 正确地识别了该数字。

下面是展示了一个学习了大量英文维基百科文章的 DBN 所生成的自然语言段落：

In 1974 Northern Denver had been overshadowed by CNL, and several Irish intelligence agencies in the Mediterranean region. However, on the Victoria, Kings Hebrew stated that Charles decided to escape during an

alliance. The mansion house was completed in 1882, the second in its bridge are omitted, while closing is the proton reticulum composed below it aims, such that it is the blurring of appearing on any well-paid type of box printer.

DBN 由多层神经元构成，这些神经元又分为显性神经元和隐性神经元（以下简称显元和隐元）。显元用于接受输入，隐元用于提取特征。因此隐元也有个别名，叫特征检测器 (feature detectors)。最顶上的两层间的连接是无向的，组成联合内存 (associative memory)。较低的其他层之间有连接上下的有向连接。最底层代表了数据向量 (data vectors)，每一个神经元代表数据向量的一维。

DBN 的组成元件是受限玻尔兹曼机 (Restricted Boltzmann Machines, RBM)。训练 DBN 的过程是一层一层地进行的。在每一层中，用数据向量来推断隐层，再把这一隐层当作下一层 (高一层) 的数据向量。

受限玻尔兹曼机

如前所述，RBM 是 DBN 的组成元件。事实上，每一个 RBM 都可以单独用作聚类器。

RBM 只有两层神经元，一层叫做显层 (visible layer)，由显元 (visible units) 组成，用于输入训练数据。另一层叫做隐层 (Hidden layer)，相应地，由隐元 (hidden units) 组成，用作特征检测器 (feature detectors)。

【转】深度学习--深度信念网络（Deep Belief Network） - 路过天堂_ellen - 狗狗的地盘_ellen

图 2 受限玻尔兹曼机的结构。图中的较上一层神经元组成隐层，较下的神经元组成显元。每一层都可以用一个向量来表示，每一维表示每个神经元。注意这两层间的对称 (双向) 连接。

神经元之间的条件独立性

应注意到，显层和隐层内部的神经元都没有互连，只有层间的神经元有对称的连接线。这样的好处是，在给定所有显元的值的情况下，每一个隐元取什么值是互不相关的。也就是说，

同样，在给定隐层时，所有显元的取值也互不相关：

【转】深度学习--深度信念网络（Deep Belief Network） - 路过天堂_ellen - 狗狗的地盘_ellen

有了这个重要性质，我们在计算每个神经元的取值情况时就不必每次计算一个，而是同时并行地计算整层神经元。

使用 RBM 的过程

假设我们现在已经得到一个训练好的 RBM，每个隐元与显元间的权重用矩阵

W表示，且：

【转】深度学习--深度信念网络（Deep Belief Network） - 路过天堂_ellen - 狗狗的地盘_ellen

其中Wij代表从第i个显元到第j个隐元的权重，M代表显元的个数，N代表隐元的个数。那么，当我们把一条新来的数据【转】深度学习--深度信念网络（Deep Belief Network） - 路过天堂_ellen - 狗狗的地盘_ellen 附给 (clamp to) 显层后，RBM 将会依照权值W来决定开启或关闭隐元。具体的操作如下：