deeplearning系列（五）实现一个简单的深度神经网络

最新推荐文章于 2024-07-28 19:04:47 发布

du_mengnan

最新推荐文章于 2024-07-28 19:04:47 发布

阅读量1.6w

点赞数 5

分类专栏： deep-learning 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012526120/article/details/49074825

版权

本文介绍了深度学习中栈式自编码神经网络的实现，首先阐述了深度学习的挑战，如数据需求、局部极值和梯度弥散。接着详细讲解了栈式自编码器的训练过程，通过逐层贪婪训练得到每层参数，并在预训练后进行微调，提升分类性能。最后，展示了代码实现和微调对分类准确率的显著提升。

摘要由CSDN通过智能技术生成

1. 深度学习概览

在浅层神经网络的介绍中，实现了包含一个隐藏层的浅层神经网络，对于这样的浅层网络，在网络训练过程中可以通过反向传播算法得到较优的网络参数值。然而，因为只有一个隐藏层，限制了模型的表达能力。

在本节中，开始介绍包含多个隐藏层的深度神经网络，经过多个隐藏层对上一层的非线性变换，深度神经网络有远超过浅层网络的表达能力。

但训练深度神经网络并不是一件十分轻松的工作，浅层神经网络的训练经验不能直接移植过来。这其中主要存在一下几方面原因：

数据量大小。浅层神经网络的训练依赖于有标签的数据。深度网络，因其远超过浅层网络的参数量，需要更多的有标签数据来训练，而通常这样的数据是很难获取的。
局部极值。神经网络是一个非凸的优化问题，对于浅层网络来说，可以通过训练使参数收敛到合理的局部极值。而深度网络是一个高度非凸的问题，存在很多的坏的局部极值，使用梯度下降法一般不能收敛到合理的参数值。
梯度弥散。使用反向传播计算梯度时，当网络层次很多时，网络前几层梯度幅值很小。使用梯度下降时，前几层参数更新速度也因此变得缓慢，这些层不能从样本中有效学习。

那么有没有可以解决这些问题的方案，从而使深度网络的训练是可行的呢？采用逐层贪婪训练得到每层参数，然后再使用解决浅层神经网络的算法（例如：BP+L-BFGS）对参数微调是一个比较可行的解决方案。

2. 栈式自编码神经网络

栈式自编码神经网络是一个由多层稀疏自编码器组成的神经网络，前一层自编码器的输出作为后一层的输入。栈式自编码神经网络参数是通过逐层贪婪训练获得的。以一个包含2个隐藏层，输出层为softmax的神经网络为例，其训练过程可以表示为：

用原始输入 $x$ 训练第一个自编码器，学习原始输入的一阶特征 $h^{(1)}$ ，如下图（左）所示；
将所有训练数据输入上面第一个自编码器，得到其一阶特征

最低0.47元/天解锁文章

关注

5
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。