DeepLearning学习随记（一）稀疏自编码器

最新推荐文章于 2024-06-04 00:44:54 发布

beck_zhou

最新推荐文章于 2024-06-04 00:44:54 发布

阅读量3w

点赞数 6

分类专栏： C/C++（win32和linux）中文分词（分词/人名识别（命名实体识别）/词性标注）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhoubl668/article/details/24800611

版权

C/C++（win32和linux）同时被 2 个专栏收录

408 篇文章 3 订阅

订阅专栏

中文分词（分词/人名识别（命名实体识别）/词性标注）

87 篇文章 7 订阅

订阅专栏

主要参考资料是Stanford 教授 Andrew Ng 的 Deep Learning 教程讲义：http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial。这个讲义已经有人翻译了（赞一个），可以参见邓侃的新浪博客http://blog.sina.com.cn/s/blog_46d0a3930101h6nf.html。另外，博客园里有一个前辈关于讲义中练习的一系列文章，在具体实现时可以参照下：http://www.cnblogs.com/tornadomeet/category/497607.html

讲义从稀疏自编码（Sparse Autoencoder）这一章节开始讲起。前面三节是神经网络、BP神经网络以及梯度检验的方法。由于还有点神经网络的相关知识，这部分不是太难懂。就从自编码器和稀疏性（Autoencoders and sparisity）记起吧。

稀疏自编码器构建：

假设我们只有一个没有类别标签的训练样本集合{x⁽¹⁾,x⁽²⁾...},一个自编码神经网络就是一种非监督学习算法，它使用BP算法，并将目标值设为输入值(y⁽ⁱ⁾=x⁽ⁱ⁾)。 Autoencoder

我们的目标是希望得到hW,b(X)≈x。用a_j⁽²⁾(x)表示输入向量x对隐藏层单元j的激活值。则j的平均激活值：

为了达到稀疏性，也即用最少（最稀疏）的隐藏单元来表示输入层的特征，我们希望所有隐藏层单元平均激活值接近于0.于是应用KL距离：

其中为了方便书写：。

这样，神经网络整体代价函数就可以表示为：，其中J（W,b）在前面BP网络章节中介绍过。

讲义中同时给出了这种情况下如何计算用于偏导数计算的残差，自己懒得去推导了，直接拿来用就好了：

将反向传导过程中残差计算公式改为：即可。

这样，一个稀疏自编码器就完成了。

个人感觉这个跟PCA貌似有点类似，可以将数据的维度降到很低（稀疏性嘛，用几个有用的隐层就可以表示出原始数据）。从Visualizing a Trained Autoencoder这节的结果来看，应该是这么个情况。

练习：

讲义中还给出了一个Exercise，Matlab用的不熟啊，这里去看了tornadomeet的博文http://www.cnblogs.com/tornadomeet/archive/2013/03/20/2970724.html，里面将代码实现了（膜拜下~），自己下下来跑了一下，结果什么的都跟原来博文一样（废话了，同一个程序，哈哈），最后没有收敛，迭代400次终止了。同时发现matlab貌似有点好用啊。。。这么几行代码就实现了，让我这用惯了C的情何以堪...回去自己补一下matlab了。

关注

6
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
DeepLearning学习随记（一）稀疏自编码器

主要参考资料是Stanford 教授 Andrew Ng 的 Deep Learning 教程讲义：http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial。这个讲义已经有人翻译了（赞一个），可以参见邓侃的新浪博客http://blog.sina.com.cn/s/blog_46d0a3930101h6nf.html。另外，博客园
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。