为什么深层网络很难训练

最新推荐文章于 2023-09-13 16:32:48 发布

PKU_Jade

最新推荐文章于 2023-09-13 16:32:48 发布

阅读量3.5k

点赞数

文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PKU_Jade/article/details/70740539

版权

为什么需要深层神经网络

第一：层数的增多会使每一层任务都变得简单，例如计算乘法，可以在第一层计算按位加法，第二层计算两个数的加法，第三层计算乘法，这样的算法逻辑更加简单，清晰。也就是说中间层可以做更深的抽象。
第二：数学上可以证明只有一层隐藏层的神经网络可以表示任意的函数，但是神经元的数量却是指数级增加的，但是使用深层网络可以解决这个问题。
所以综上深层神经网络可以解决浅层神经网络无法轻易解决的问题。

但是如果我们使用随机梯度下降训练深层神经网络的话，就会发现结果并没有比浅层神经网络好。这是因为不同的层学习速度差很多，后面的层学习更快，这是因为我们使用的是基于梯度的学习算法。

The vanishing gradient problem

在使用MLP识别MNIST时我们会发现，一味的增加隐藏层数量并不会给最终的结果带来好处，但是上文已经说了层数的增加可以使神经网络提升，那么问题的原因就是增加后的网络的权重不对。
δl

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
为什么深层网络很难训练

为什么需要深层神经网络第一：层数的增多会使每一层任务都变得简单，例如计算乘法，可以在第一层计算按位加法，第二层计算两个数的加法，第三层计算乘法，这样的算法逻辑更加简单，清晰。也就是说中间层可以做更深的抽象。第二：数学上可以证明只有一层隐藏层的神经网络可以表示任意的函数，但是神经元的数量却是指数级增加的，但是使用深层网络可以解决这个问题。所以综上深层神经网络可以解决浅层神经网络无法轻易解决的问
复制链接

扫一扫

专栏目录

PKU_Jade CSDN认证博客专家 CSDN认证企业博客

码龄7年

129: 原创

18万+: 周排名

120万+: 总排名

24万+: 访问

: 等级

3362: 积分

38: 粉丝

71: 获赞

23: 评论

126: 收藏

私信

关注

热门文章

最新评论

[python]回溯法模板
panqihuan33: 把3删除后templist=[1,2],，跳出第三层的循环后，继续第二层i=2的循环，把2也删除了，然后进行i=3的循环
[python]回溯法模板
30岁头发多多: 第一次把3删除，里面还有1，2在循环不还是加3进去吗。完全搞不懂
[python]回溯法模板
inside802: 这个图画的太棒了！瞬间通俗易懂！
【译】理解LSTM网络，RNN入门材料
进无止境elite: h应该代表hidden state
tf.control_dependencies()作用及用法
xxaxtt: 无顺序，并行的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。