深度学习笔记（十二）为什么用深层神经网络而非浅层？

最新推荐文章于 2023-03-06 20:50:18 发布

Mr.zwX

最新推荐文章于 2023-03-06 20:50:18 发布

阅读量1.7k

点赞数 2

分类专栏：【深度学习/神经网络】Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16763983/article/details/112211021

版权

【深度学习/神经网络】Deep Learning 专栏收录该内容

86 篇文章 47 订阅

订阅专栏

我们知道一个并不大（神经元数量不多）但是够深（隐藏层数量多）的神经网络可以解决非常多现实中的问题，那么为什么这样就可以达到更好的效果呢？

在这里插入图片描述
对于人脸识别这个例子（之后的卷积神经网络会细讲），来分析以下神经网络的每一层在做什么？

第一层：边缘探测器，从比较细微的那些细节入手，比如边缘
第二层：扩大到更复杂一些的区域，比如 👀 👂 等
第三层：再把 👀 👂 这样的区域组合成更复杂的整体，得到人脸

总的来说，这是金字塔型从易到难的表示方法，这种思想可以应用到图像识别、声音识别等多个领域。

如果是声音的识别，第一层会探测低层次的音频波形特征（比如音调是变高了还是变低了，分辨白噪音的“嘶嘶嘶”等），然后把这些波形组合在一起，于是就可以探测声音的基本单元。在语言学中有个概念叫做音位（比如cat的第一个发音c，音标就我就不标上了，意会一下c的发音“咳”，对吧），于是识别了cat中“c”“a”“t”三个音位后，组合识别音频中的单词，再组合识别词组，最终到完整的句式。

电路理论
还有一个关于神经网络为何有效的理论，就是电路理论。
在这里插入图片描述
在计算数字逻辑运算时，可以采用上图中左右两种方法

左边的方法两两组合运算，再进一步组合，最终得到输出值。将每一次的运算看作一层网络，那么这种方法实际上是多隐藏层的结构，复杂度为 $O (n l o g n)$
右边的方法仅仅依靠一个隐藏层，直接计算得到最终的输出值。因为仅仅只有一个隐藏层，所以神经元的数量会呈指数增加，复杂度 $O(2^n)$
对比可见，借助多隐藏层的网络结构有更高的效率，这也是为什么选择深层神经网络表示原因了

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.zwX 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。