李宏毅2020机器学习课程笔记-Introduction

1、作业情况

首先根据15个作业来说明本次课程要讲解的主体内容:
其中,蓝色圈圈表示(数分钟完成) 黄色三角表示(数小时完成)红色星星表示(数日完成)
在这里插入图片描述

2、什么是机器学习?

简单来说,机器学习就是自动找到一个函数来帮我们解决问题的。

  • 比如你输入一段语音,机器学习就会找到一个函数来识别出语音中的文字
  • 你输入一个猫猫的图片,机器就会找到一个函数来说明它就是一只猫
  • alpha GO
  • 对话机器人

3、我们要找什么样的函数?

根据,不同的问题情境,我们需要不同的函数

  • Rregression,注意当我们需要的输出是一个数值时,我们就要这样一个function
  • classfication,我们想要的结果就是判断yes or no的问题时(二分类问题),我想要找一个这样一个function;同样,也有多分类的问题,也即让机器在n个选项中,选择正确的哪一项,让机器进行选择。
  • Generation,生成类问题,我们想让机器学习如何创造一个事物。

对于我们不同的需求,有以上不同的function 可以来定义,李老师补充说明了这三者之间的关系:你以为回归和分类已经是五大洲,但相较于Generation,Genderation才是最后的黑暗大路。
在这里插入图片描述

4、怎么样告诉机器我们要什么样的函数

我们心里已经想好了用什么样的函数,那怎么把我们心里的想法传递给机器呢?我们可以通过Supervise Learning,Reinforcement Learning和Unsupervised Learning这些方式。
比如,我们需要找到这样一个函数,输入一个图片,输出这个图片属于什么类别,是猫还是狗…
在这里插入图片描述
在supervise learning的想法里面,我们怎么告诉他我们想要的函数长什么样子呢?我们需要给机器一些训练资料,让机器知道,给一张狗的图片,我们希望他输出一只狗,给一张猫的图片我们希望她输出一只猫,这也是对数据label的过程。这样我们就知道了,给机器一堆被标注的训练数据去学习的过程就是supervise learning。那机器是怎样进行学习的呢? 当我们提供给机器一堆带标注的训练数据时,机器就能评估函数的好坏,利用函数的loss,使这个loss越小越好,越小就说明输出的结果就是离我们心里想要的结果越近。

  1. Supervised Learning(监督学习)
    监督学习需要大量的training data(训练数据),training data告诉机器针对这个 input 你要输出一个什么样的output。因为这里的training data已经对这写数据进行了人工标注,通常我们称其为标签。也就是说,我们要使用supervised learning这样一种技术,我们需要告诉机器,function的input和output分别是什么,而这种output通常是通过人工的方式标注出来的,因此称为人工标注的label,它的缺点是需要大量的人工 effort。
  2. Reinforcement Learning(强化学习)
    区别于监督学习,Supervised Learning会告诉机器正确的答案是什么 ,其特点是Learning from teacher
    比如,训练一个聊天机器人,告诉他如果使用者说了“Hello”,你就说“Hi”;如果使用者说了“Bye bye”,你就说“Good bye”;就好像有一个家教在它的旁边手把手地教他每一件事情
    Reinforcement Learning 没有告诉机器正确的答案是什么,机器最终 得到的只有一个分数,就是它做的好还是不好,但他不知道自己到底哪里做的不好,他也没有正确的答案;很像真实社会中的学习,你没有一个正确的答案,你只知道自己是做得好还是不好。其特点是Learning from critics
    比如,训练一个聊天机器人,让它跟客人直接对话;如果客人勃然大怒把电话挂掉了,那机器就学到一件事情,刚才做错了,它不知道自己哪里做错了,必须自己回去反省检讨到底要如何改进,比如一开始不应该打招呼吗?还是中间不能骂脏话之类的。
  3. UnSupervised Learning(无监督学习)
    与监督学习进行对比,无监督学习就是要学习没有经过标注的数据,让机器无师自通,看机器能够学到什么东西。

5、机器如何实际找出我们想要的函数

我们已经告诉机器我们想要的函数长什么样子,那机器是怎样找到这个函数的呢?

首先给函数一个寻找范围,从简单的线性函数开始,之后再到我们的复杂的函数(也即我们后边会学到的神经网络)之后我们通过优化算法来找到最好的函数。

6、前沿研究

  1. Explainble AI
  2. Adversarial Attack
  3. NetWork compression(网络压缩)
  4. Anonaly dection
  5. Transfer Learning(迁移学习)
  6. meta learning(学习如何学习)
  7. life long learning(终身学习)
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值