【李宏毅机器学习】Why Deep Learning(p15) 学习笔记

全文总结于哔哩大学的视频:李宏毅2020机器学习深度学习(完整版)国语

2020版课后作业范例和作业说明在github上:点击此处

李宏毅上传了2020版本的机器学习视频和吴恩达的CS229机器学习相比,中文版本的机器学习显得亲民了许多,李宏毅的机器学习是英文的ppt+中文讲解,非常有利于大家入门。吴恩达的CS229中偏向于传统机器学习(线性回归、逻辑回归、Naive Bayes、决策树、支持向量机等),李宏毅2020版本的机器学习中除了最前面的回归、分类,后面更多篇幅涉及卷积神经网络(CNN)、循环神经网络(RNN)、强化学习(RL)等深度学习的内容。

博客内容多为转载。结合哔哩大学的视频观看效果更佳。
在这里插入图片描述

文章目录

Deep is better

在这里插入图片描述

Fat+Short vs Thin+Tall

shallow vs deep
在这里插入图片描述

在这里插入图片描述
为什么deep learning不是简单的增加参数,来实现好的效果?

Modularization 模块化

做deep learning 实际上就是做模块化的过程

并不是在主函数里放入所有的东西,而是写了很多小的function,降低程序复杂度,使其变得简洁
在这里插入图片描述
长头发男生和短头发女生的数据都很少
在这里插入图片描述
将直接判断长头发男生还是短头发女生的问题,拆分为,先判断男孩女孩,再判断长头发短头发,这样就不会出现数据太少的问题(长/短头发,男女生的数量都很多)
在这里插入图片描述

深度模型就是特征提取模块+分类器模块

每个分类器去参考前面的基础分类器,把他们当作module模块,每个分类器都共用同样的模块。即,后面的分类器可以利用前面的分类器。
在这里插入图片描述

每一个neural相当于一个基础分类器,后一层的neural把前一层基础分类器的output当作input,以此类推,,,

在deep learning中,模块化是从数据中自动学到的。

做modularization的好处是把复杂模型变得简单,就算训练数据不多,也可以做好。

Deep Learning反而需要更少的数据!而不是需要更多的数据才可以深度学习。

如果有足够的数据,直接table lookup查表就好了,就不需要Machine Learning了。
而我们没有足够的数据,就无法查表,所以需要Deep Learning
在这里插入图片描述

Modularization - Image

在这里插入图片描述

Modularization - Speech

人类语言的分层化结构

Phoneme:音素
Tri-phone:三音素
同样的音素可能会有不同的发音
在这里插入图片描述

语音辨识的步骤

The first stage of speech recognition 的第一步

分类:输入声学特征,输出state
每隔一段时间取一个window,得到一系列的声学特征
第一步做的工作就是:决定每一个声学特征属于哪个state,仅此而已,还有其他很多步骤,在此不讨论。
在这里插入图片描述

Each state has a stationary distribution for acoustic features.(每个state对于声学特征有着平稳的分布)

对比Deep learning前后,语音辨识模型有什么不同。

要做的事情,在语音辨识第一阶段的任务就是分类,决定每个声学特征属于哪个state

传统方法:

中英文会有很多的tri-phone,每一个Phoneme 随着文本的不同,也要用不同的model,所以会遇到训练数据不够的情况。

在这里插入图片描述

有一些state会共用同样的model distribution,相当于不同的pointer指向了相同的address
在这里插入图片描述

深度学习出现后的方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

难得听懂的重点

在这里插入图片描述

  • 比如100个神经元,1层的话只能表示网络能表示的情况的集合,就是function set。
  • 而多层还可以表达“元素”间的位置关系(搭配关系)。

在这里插入图片描述
在这里插入图片描述

折叠空间

将空间做各种对折,就可以有复杂图案

一笔data可以发挥5笔data的作用
Deep Learning可以充分利用数据

在这里插入图片描述


hidden layer多的模型,在数据少的时候效果好
在这里插入图片描述


在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

DeepLearning其他好处

在这里插入图片描述
不同的人说相同的话,经过多层hidden layer之后,就聚合在一起了

在这里插入图片描述
在这里插入图片描述

手写数字识别
在这里插入图片描述

还有更多使用deep learning的理由

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值