台大李宏毅老师——深度学习课程笔记七（Why DNN Modularization)

大叔爱学习.

已于 2022-03-03 07:48:06 修改

阅读量286

点赞数 1

分类专栏：深度学习文章标签：深度学习 dnn 人工智能

于 2022-03-01 22:55:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43716712/article/details/123203048

版权

深度学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

Intorduction
Modularization
Modularization in Speech
Universality Theorem
End-to-End Learning
Complex Task

Intorduction

在这里插入图片描述
为什么越深，error rate越低？

所以是shallow更好，还是Deep更好呢？

从上图可以看出，还是越深越好，而不是越胖越好，为什么呢？

Modularization

在这里插入图片描述
模块化的思想。如同我们写函数，都是对象函数，然后调用不同的对象函数完成不同的功能，那么这个思想在DNN中是怎样的？

如果我们训练4个classifier，可以看出，因为长发男生数据比较少，那么classifier2就训练的比较弱
在这里插入图片描述
Modularization就可以先训练2个basic classifier，比如男vs女，长发vs短发。
这时候，我们在利用前面的basic classifer，再去分成4个分类器。从上图可以看到DNN的结构了。

每一层都是不同的classifer，越往前的层，每一个neuron越basic。这是自动学习到的。这个图像识别也可以解释，前面层都是学习的基础图案，后面是图案的拼接。
在这里插入图片描述
其实Deep Learning的功能是大数据是相反的，就是因为我们没有足够的数据，所以才会用Deep learning。

在这里插入图片描述
图片上的。

Modularization in Speech

在这里插入图片描述

不同的state share相同的distribution。

绿色的母音其实只是受到3个因素的影响。这个因素就是舌头的位置、嘴形等。所以不是每一个phoneme都独立的。而是用DNN，它们之间有关系。

所有的state用了同一个DNN model。
在这里插入图片描述

左下图是hidden layer的output，可以看出，DNN会先辨别最初的几个音。
靠近output是越来越区分的phoneme。

Universality Theorem

在这里插入图片描述

这个理论是说只能用一个layer就可以。这个结构只是说明hidden layer够宽，可以描述任何function，但是它没有讲它的效率问题。

在这里插入图片描述
虽然2层的逻辑闸可以做任何事情，但是工程上面，不会这样做，而是用多层的逻辑闸，这样有效率。
所以我们用DNN多的layer，比较有效率，可以用更少的数据。

在这里插入图片描述
就好像剪窗花，我们叠的越多，最后操作的就少。

蓝色点重合，就好像剪窗花，对折了一样。

在这里插入图片描述
3个layer的时候，可以看出，当数据少的时候，他效果虽然不好，但是还可以看出一点模样。但是1个layer的，就完全破坏了。

End-to-End Learning

在这里插入图片描述
当我们不告诉Model怎么做，而让他自己学习的时候，就是用DNN。让它自己学习。

下图是DNN之前的语音识别，只有蓝色是traning的
在这里插入图片描述
DNN开发之后：

会把之前的所有步骤，都换成hidder layer。

Complex Task

在这里插入图片描述

经过8个hidden layer，不同人说话居然开始聚合了。

当层数加多，可以看出，数字被分得很开。就是为什么要DNN。

大叔爱学习.

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
台大李宏毅老师——深度学习课程笔记七（Why DNN Modularization)

文章目录IntorductionModularizationModularization in SpeechIntorduction为什么越深，error rate越低？所以是shallow更好，还是Deep更好呢？从上图可以看出，还是越深越好，而不是越胖越好，为什么呢？Modularization模块化的思想。如同我们写函数，都是对象函数，然后调用不同的对象函数完成不同的功能，那么这个思想在DNN中是怎样的？如果我们训练4个classifier，可以看出，因为长发男生数据比较少，那
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。