李宏毅2020ML——P15 为什么deep learning

最新推荐文章于 2022-05-26 09:25:38 发布

小葵向前冲

最新推荐文章于 2022-05-26 09:25:38 发布

阅读量155

点赞数 1

分类专栏：李宏毅2020ML 文章标签：机器学习深度学习人工智能 python

本文链接：https://blog.csdn.net/weixin_44177594/article/details/114839360

版权

李宏毅2020ML 专栏收录该内容

32 篇文章 0 订阅

订阅专栏

why deep?

Shallow V.s. Deep

Shallow V.s. Deep

简单对比

传统对deep learning认知
在这里插入图片描述
既然大量的data加上参数足够多的model就可以实现这个效果，那为什么一定要用DNN呢？我们完全可以用一层的shallow neural network来做同样的事情，理论上只要这一层里neuron的数目足够多，有足够的参数，就可以表示出任何函数；那DNN中deep的意义何在呢？

Fat + Short v.s. Thin + Tall
在这里插入图片描述
对比的结果如下：

这个时候你会发现，在参数数量接近的情况下，只有1层的network，它的error rate是远大于好几层的network的；这里甚至测试了116k大小的shallow network，把它跟左侧也是只有一层，但是没有那么宽的network进行比较，由于参数比较多所以才略有优势；但是把116k大小的shallow network和参数远比它少的2*2k大小的deep network进行比较，结果竟然是后者的表现更好

也就是说，只有1层的shallow network的performance甚至都比不过很多参数比它少但层数比它多的deep network，这是为什么呢？

有人觉得deep learning就是一个暴力辗压的方法，我可以弄一个很大很大的model，然后collect一大堆的data，就可以得到比较好的performance；但根据上面的对比可知，deep learning显然是在结构上存在着某种优势，不然无法解释它会比参数数量相同的shallow learning表现得更好这个现象

Modularization

在这里插入图片描述

example

在这里插入图片描述
==less training data ，better results ==

Speech

前面讲了deep learning的好处来自于modularization(模块化)，可以用比较efficient的方式来使用data和参数，这里以语音识别为例，介绍DNN的modularization在语音领域的应用
在这里插入图片描述

传统做法

在这里插入图片描述

结论

在这里插入图片描述

举例

在这里插入图片描述

End-to-end Learning

在这里插入图片描述

Complex Task

在这里插入图片描述

小葵向前冲

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅2020ML——P15 为什么deep learning

why deep?Shallow V.s. Deep简单对比ModularizationexampleSpeech传统做法结论举例End-to-end LearningComplex TaskShallow V.s. Deep简单对比传统对deep learning认知既然大量的data加上参数足够多的model就可以实现这个效果，那为什么一定要用DNN呢？我们完全可以用一层的shallow neural network来做同样的事情，理论上只要这一层里neuron的数目足够多，有足够的参数，就可
复制链接

扫一扫

专栏目录