稀疏自动编码之可视化自动编码器

对于训练出的一个稀疏自动编码器,现在想看看学习出的函数到底是什么样子。对于训练一个\textstyle 10 \times 10的图像,\textstyle n = 100.计算每一个隐层节点  \textstyle i  的输出值:

\begin{align} a^{(2)}_i = f\left(\sum_{j=1}^{100} W^{(1)}_{ij} x_j  + b^{(1)}_i \right). \end{align}

我们要可视化的函数,就是这个以一副2D图像为输入,以\textstyle W^{(1)}_{ij} 为参数(忽略偏置项),由隐层节点 \textstyle i 计算出来的函数。特别是,我们把 \textstyle a^{(2)}_i 看作是输入 \textstyle x 的非线性特征。我们很想知道:什么样的的图像 \textstyle x 能使得 \textstyle a^{(2)}_i 成为最大程度的激励? 还有一个问题,就是必须对 \textstyle x 加上约束。如果假设输入的范数约束是\textstyle ||x||^2 = \sum_{i=1}^{100} x_i^2 \leq 1,可以证明,能够使得隐层神经元得到最大程度激活的像素输入 \textstyle x_j  (所有100个像素点,\textstyle j=1,\ldots, 100):

\begin{align} x_j = \frac{W^{(1)}_{ij}}{\sqrt{\sum_{j=1}^{100} (W^{(1)}_{ij})^2}}. \end{align}

展示出由这些像素灰度值的构成的图像,我们就可以看到隐层节点学习出了什么样的特征。

如果训练出一个含有100个隐层节点的自动编码器,那么我们可视化将会产生100幅图像(每个隐层节点对应一幅)。通过测试这100幅图像,试着理解隐层学习出的整体效果。

下面给出了一个稀疏编码器(100个隐层节点,输入是\textstyle 10 \times 10的图像)学习出的结果:

 上图的每个小方块都给出了一个输入图像\textstyle x,它可使这100个隐藏单元(隐层节点)中的某一个获得最大激励。我们可以看到,不同的隐藏单元学会了在图像的不同位置和方向进行边缘检测。这些特征对于物体识别和其他视觉学习任务很有用。当应用到其他领域(如音频),这个算法同样可以学习出很有用的表示或者特征。

 

学习来源:http://deeplearning.stanford.edu/wiki/index.php/Visualizing_a_Trained_Autoencoder

转载于:https://www.cnblogs.com/90zeng/p/Visualizing_a_Trained_Autoencoder.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值