Helmholtz Machine and Wake-Sleep Learning

最新推荐文章于 2021-09-07 14:23:11 发布

zhlei12345

最新推荐文章于 2021-09-07 14:23:11 发布

阅读量2.1k

点赞数

分类专栏：机器学习深度学习文章标签：神经网络 Helmholtz

本文链接：https://blog.csdn.net/zhlei12345/article/details/50449056

版权

本文深入探讨了无监督学习中的Helmholtz机器和wake-sleep算法，该算法与神经网络的训练密切相关。文章介绍了Boltzmann分布的概念，并详细阐述了Helmholtz机器的结构，包括其识别和生成模型的双重参数系统。通过wake-sleep算法的两个阶段，即样本生成和参数调整，逐步解释如何最大化受惩罚的似然函数以优化神经网络。

摘要由CSDN通过智能技术生成

$\textbf{1.介绍.}$ 本文主要目的是服务于深信度网络。我们将在这里介绍神经网络无监督学习中的一个重要算法wake-sleep算法，以及和这种算法密切相关的一类机器–Helmholtz machine.
$\textbf{2.Boltzmann distribution.}$ 在一个物理系统中，颗粒处在不同的状态下的概率分布称为Boltzmann distribution。其中状态 $i$ 出现的概率为

p i = e - E i / k T \sum M i = 1 e - E i / k T

$p_i=\frac {e^{-E_i/kT}}{\sum_{i=1}^{M} e^{-E_i/kT}}$
其中每一种状态的概率和状态能量

Ei $E_i$ 相关，M表示所有可能的状态数，k为常数，T表示系统的温度。

3.Helmholtz machine. $\textbf{3.Helmholtz machine.}$

简要介绍. $\color{red}{简要介绍.}$ Helmholtz machine属于无监督学习。它主要包括两个部分：recognition model 和generative model。这两个部分类似于神经网络。recognition model 是从输入层到隐藏层的传播（自下而上传播），这个部分主要是用于识别输入数据，使得输入数据可以被隐藏层更好的表示，generative model 是从隐藏层到输入层的传播（自上而下传播），这个部分是用于生成输入数据。其目的就是构造一个网络，从而很好的表述输入数据的特征。