台大李宏毅Machine Learning 2017Fall学习笔记 (12)Why Deep?

最新推荐文章于 2022-10-07 22:02:47 发布

Allenlzcoder

最新推荐文章于 2022-10-07 22:02:47 发布

阅读量598

点赞数

分类专栏：台大李宏毅Machine Learning 2017Fall 文章标签：机器学习深度学习 machine-learning deep-learning 李宏毅

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Allenlzcoder/article/details/79069839

版权

台大李宏毅Machine Learning 2017Fall 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

台大李宏毅Machine Learning 2017Fall学习笔记 (12)Why Deep?

本博客整理自：
http://blog.csdn.net/xzy_thu/article/details/69808817
在比较浅层网络与深层网络时，要让“矮胖”的网络和“高瘦”的网络的参数数目相等，这样比较才公平。
即便是在深层网络参数较少的情况下，深层网络也会比浅层网络表现好。
这是因为“深层”其实相当于“模组化”，第一个隐层是最基本的分类器，第二个隐层是用第一个隐层建造的分类器，以此类推。
这里写图片描述

浅层网络确实可以表示任意函数，但是使用深层结构更有效率。
好比逻辑门电路，用两层逻辑门就可以实现任何布尔函数，但是用多层结构更简单、需要的逻辑门更少。
神经网络也是如此，单隐层网络可以表示任何连续函数，但是多层结构表示起来更简单、需要的神经元更少，所以比较不容易overfitting，或只需较少的data。
而且，深层结构可以比较有效率地使用data。
这里写图片描述

1层hidden layer与3层hidden layer（相同数目的参数），3层的效果更好。
但理论上，3层可达到的效果，1层也能达到：要在1层learn的时候，target从真实label改为3层的output，这样1层的结果会接近3层的结果。
在语音识别、图像识别和更复杂的任务上，更“深”的网络结构更容易取得好的结果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。