李宏毅深度学习_Task01

学习目标:

1.机器学习的介绍
2.了解机器学习的相关技术
3.了解课程的learning map


学习内容:

参照开源文档,观看视频P1:机器学习介绍,P2:为什么学习机器学习


学习产出:

1、机器学习介绍

(1)机器学习与人工智能、深度学习的关系

人工智能是 目标,而机器学习是手段(方法),其中的深度学习是重要的方法。

人工智能与机器学习深度学习的关系

(2)机器学习的定义

  吴恩达教授的课程中,我们学到一个更加现代的定义:A computer program is said to learn from experience E with respect to some class of task T and performence measure P ,if its performence at task in T , as measured by P ,improves with experence E。
  在本节课中,李宏毅教授的课程中,将机器学习所做的事情,可以想象想成就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们要寻找的function。然后利用这个函数来解决问题。
  两者的定义其实并无太大的区别,但是李宏毅教授课程中更加强调机器学习的目的:寻找一个function

机器学习的目的

  如在语音辨识这个问题里面,我们要找一个function,它的输入是声音讯号,他的输出是语音辨识的文字;要做影像辨识,那就是找一个function,输入一张图片,然后输出图片里面有什么样的东西;或者是大家都一直在说的Alpha GO,如果你要做一个可以下围棋machine时,其实你需要的也就是找一个function。这个function的输入是围棋上十九* 十九的棋盘。告诉机器在十九* 十九的棋盘上,哪些位置有黑子,哪些位置有白子。然后机器就会告诉你,接下来下一步应该落子在哪。或者是你要做一个聊天机器人,那你需要的是一个function,这个function的输入就是使用者的input,它的输出就是机器的回应。

在这里插入图片描述

(3)机器学习的框架

寻找function的步骤:
第一步:准备一个function set(集合) ,找一个 function。function 也被称为model(模型)
第二步:让machine可以衡量一个function是好还是不好。
第三步:让machine有一个自动的方法,有一个好演算法可以挑出最好的function
上述整个过程的目的就是寻找一个最佳的function,此过程也被称为Training

训练的步骤

找到function之后,我们希望用它应用到一些场景中,比如:影像辨识,输入一张在机器没有看过的猫,然后希望输出也是猫。

测试过程

  那整个机器学习的框架可以归纳为下面的形式,左边这个部分叫training,就是学习的过程;右边这个部分叫做testing,学好以后你就可以拿它做应用。

  对于这个框架,以下是我的看法:我觉得这个框架更像一个监督学习的流程框架,因为框架中涉及到了训练样本。或者说如果可以将training data 改成 data (不区分训练样本和测试样本),可能更像一个机器学习的流程框架。

机器学习的框架

2、机器学习的相关技术介绍

(1)学习的情景(Scenario)

  学习的情景的主要内容包括:Supervised Learning(监督学习)、Semi-supervised Learning(半监督学习)、Transfer Learning(迁移学习)、Unsupervised Learning(⽆监督学习)、Reinforcement Learning(强化学习)。
  通常学习的情境是我们没有办法控制的,⽐如做强化学习是因为我们没有带标签的data、没有办法来做监督学习的情况下才去做的。如果有带标签的data,监督学习当然⽐强化学习要好;因此⼿上有什么样的data,就决定你使⽤什么样的scenario。

Supervised Learning(监督学习):
  监督学习就是利用大量的training data,告诉机器function的input和output分别是什么,来寻找function的input与output之间的关系从而确定function。(其中的training data,也是由input与output构成,其中output通常被叫做label(标签)。)
  缺点:需要大量的训练集,需要人工标注(是需要⼤量的⼈⼒劳动)
  监督学习的主要任务是:回归、分类和结构化学习

Semi-supervised Learning(半监督学习):
  目的: 克服监督学习中需要耗费人力进行标注的问题。
  半监督学习适用于有少量的labeled data,和大量unlabeled data

在这里插入图片描述

  半监督学习例子: 如果想要做⼀个区分猫和狗的function,⼿头上有少量的labeled data,它们标注了图⽚上哪只是猫哪只是狗;同时⼜有⼤量的unlabeled data,它们仅仅只有猫和狗的图⽚,但没有标注去告诉机器哪只是猫哪只是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。

Transfer Learning(迁移学习):
  目的: 也可以减少监督学习中需要大量的training data的问题。
  迁移学习适用于data中含有一些未知的label,可以某个领域或任务上学习到的知识应用到不同的但相关的领域或问题中。

在这里插入图片描述

  迁移学习例子: 假设我们要做猫和狗的分类问题,我们也一样,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片(凉宫春日,御坂美琴)你有这一大堆不相干的图片,它到底可以带来什么帮助。
  迁移学习主要要解决的问题是,不相⼲的data可以对结果带来什么样的帮助。

Unsupervised Learning(⽆监督学习):
  无监督学习就是希望机器学到⽆师⾃通,解决如果在完全没有任何label的情况下,到底机器可以学到什么样的事情。无监督学习的主要任务是聚类

Reinforcement Learning(强化学习):
  Supervised Learning:我们会告诉机器正确的答案是什么 ,其特点是Learning from teacher
  Reinforcement Learning: 我们没有告诉机器正确的答案是什么,机器最终得到的只有⼀个分数,就是它做的好还是不好,但他不知道⾃⼰到底哪⾥做的不好,他也没有正确的答案。其特点是Learning from critics
在这里插入图片描述

  强化学习与监督学习对比例子: 比如训练⼀个聊天机器⼈,Supervised Learning: 告诉他如果使⽤者说了“Hello”,你就说“Hi”;如果使⽤者说了“Byebye”,你就说“Good bye”;就好像有⼀个家教在它的旁边⼿把⼿地教他每⼀件事情。而 Supervised Learning: 让它跟客⼈直接对话;如果客⼈勃然⼤怒把电话挂掉了,那机器就学到⼀件事情,刚才做错了,它不知道⾃⼰哪⾥做错了,必须⾃⼰回去反省检讨到底要如何改进,⽐如⼀开始不应该打招呼吗?还是中间不能骂脏话之类的。

(2)学习的任务(Task)

  监督学习:回归、分类(多元分类、二分类)、结构化学习
  非监督学习:聚类

Regression(回归):
  特点是通过regression找到的function,它的输出是⼀个scalar(标量)continuous(连续) 的数值。

在这里插入图片描述

  回归例子: 比如PM2.5的预测,给machine的training data是过去的PM2.5资料,⽽输出的是对未来PM2.5的预测数值,这就是⼀个典型的regression的问题

Classification(分类):
  Regression和Classification的差别就是我们要机器输出的东西的类型是不一样,根据吴恩达教授的课程,我们知道Regression的输出的是continuous valued output且function 是continuous;而Classification输出的是discrete valued output且function属于discrete categories。(在Regression中机器输出的是一个数值,在Classification里面机器输出的是类别)
  吴恩达教授视频中二者区别:
    Regression:(1)Predict results within a continuous output (2)Map input variables to some continuous function
    Classification:(1)Predict results in discrete output (2)Map input variables into discrete categories

在这里插入图片描述

Classification⼜分为两类:
  (1)Binary Classification(⼆元分类):在binary classification⾥,我们要机器输出的是yes or no,是或否。举例说明: G-mail的spam filtering(垃圾邮件过滤器),输⼊是邮件,输出是该邮件是否是垃圾邮件
  (2)Multi-class classification(多元分类)::在multi-class classification⾥,机器要做的是选择题,等于给他数个选项,每⼀个选项就是⼀个类别,它要从数个类别⾥⾯选择正确的类别。举例说明: document classification(新闻⽂章分类),输⼊是⼀则新闻,输出是这个新闻属于哪⼀个类别(选项)

Structured Learning(结构化学习):
  structured learning 中让机器输出的是一个有结构性的东西

在这里插入图片描述

  结构化学习例子: 举例来说在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。或者你今天要做的是人脸辨识,来给机器看张图片,它会知道说最左边是长门,中间是凉宫春日,右边是宝玖瑠。然后机器要把这些东西标出来,这也是一个structure learning问题。

GAN 也是structured learning的⼀种⽅法。

(3)学习的方法(Method)

  1.监督学习:
      线性方法(Linear Model):线性回归模型
      非线性方法(Non-linear Model):深度学习(deep learning)、SVM、decision tree、K-NN
  2.无监督学习:
     K-means

3、该课程的Learning Map

在这里插入图片描述

 参考文献:
 https://datawhalechina.github.io/leeml-notes/#/chapter1/chapter1?id=%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0%e7%9b%b8%e5%85%b3%e7%9a%84%e6%8a%80%e6%9c%af
 https://www.yuque.com/preview/yuque/0/2021/pdf/12417658/1628954544320-ee1fbb29-8c92-4fe9-8825-0ffc5c4bf5cd.pdf?from=https://www.yuque.com/docs/share/f973c7b8-8675-4ad8-950d-dfea713e7e39
 https://www.bilibili.com/video/BV1Ht411g7Ef      
 https://www.coursera.org/learn/machine-learning
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值