《深度学习》学习笔记（一）：稀疏自编码器（Sparse Autoencoder）

最新推荐文章于 2024-06-26 11:08:00 发布

chenynCV

最新推荐文章于 2024-06-26 11:08:00 发布

阅读量4.2w

点赞数 18

分类专栏：深度学习文章标签：稀疏自编码器 matlab UFLDL Deep Learning 深度学习

本文链接：https://blog.csdn.net/u010278305/article/details/46881443

版权

本文介绍了深度学习中的稀疏自编码器，它是一种能从无标注数据自动学习特征的神经网络。通过UFLDL教程学习，展示了稀疏编码器如何发现并提取输入数据的边缘特征，提高数据描述的效率。文章探讨了稀疏性的概念，以及在sigmoid激活函数下神经元的平均活跃度。

摘要由CSDN通过智能技术生成

本笔记主要记录学习《深度学习》的总结体会。如有理解不到位的地方，欢迎大家指出，我会努力改正。

在学习《深度学习》时，我主要是通过Andrew Ng教授在 http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial上提供的UFLDL（Unsupervised Feature Learning and Deep Learning）教程，本文在写的过程中，多有借鉴这个网站提供的资料。

稀疏自编码器（Sparse Autoencoder）可以自动从无标注数据中学习特征，可以给出比原始数据更好的特征描述。在实际运用时可以用稀疏编码器发现的特征取代原始数据，这样往往能带来更好的结果。本文将给出稀疏自编码器的算法描述，并演示说明稀疏编码器自动提取边缘特征。

转载请注明出处：http://blog.csdn.net/u010278305。

稀疏自编码器是具有一层隐含层的神经网络，其思路是让输出等于输入，（即 $\textstyle y^{(i)} = x^{(i)}$ ，其中 $\textstyle \{x^{(1)}, x^{(2)}, x^{(3)}, \ldots\}$ 表示训练样本集合），让编码器自己发现输入数据中隐含的特征，自编码神经网咯的结果如下图：

自编码神经网络尝试学习一个 $\textstyle h_{W,b}(x) \approx x$ 的函数。换句话说，它尝试逼近一个恒等函数，从而使得输出 $\textstyle \hat{x}$ 接近于输入 $\textstyle x$ 。这样往往可以发现输入数据的一些有趣特征，最终我们会用隐藏层的神经元代替原始数据。当隐藏神经元数目少于输入的数目时，自编码神经网络可以达到数据压缩的效果（因为最终我们可以用隐藏神经元替代原始输入，输入层的n个输入转换为隐藏层的m个神经元，其中n>m,之后隐藏层的m个神经元又转换为输出层的n个输出，其输出等于输入）；当隐藏神经元数目较多时，我们仍然可以对隐藏层的神经元加入稀疏性限制来发现输入数据的有趣结构。

稀疏性可以被简单地解释如下。如果当神经元的输出接近于1的时候我们认为它被激活，而输出接近于0的时候认为它被抑制，那么使得神经元大部分的时间都是被抑制的限制则被称作稀疏性限制。这里我们假设的神经元的激活函数是sigmoid函数（如果你使用tanh作为激活函数的话，当神经元输出为-1的时候，我们认为神经元是被抑制的）。

我们使用 $\textstyle a^{(2)}_j(x)$ 来表示在给定输入为 $\textstyle x$ 情况下，自编码神经网络隐藏神经元

最低0.47元/天解锁文章

chenynCV

关注

18
点赞
踩
162

收藏

觉得还不错? 一键收藏
6
评论
《深度学习》学习笔记（一）：稀疏自编码器（Sparse Autoencoder）

本笔记主要记录学习《深度学习》的总结体会。主要学习途径为UFLDL教程，本篇记录我对稀疏自编码器（Sparse Autoencoder）的理解，并具有完整的matlab代码实现，可以直接运行查看效果。
复制链接

扫一扫

专栏目录