【李宏毅机器学习】01：机器学习介绍 Introduction

BkbK-

已于 2022-11-07 15:40:09 修改

阅读量532

点赞数 9

分类专栏：学习笔记文章标签：深度学习人工智能李宏毅介绍

于 2021-01-26 11:51:29 首次发布

本文链接：https://blog.csdn.net/BlacKingZ/article/details/113172869

版权

学习笔记同时被 2 个专栏收录

89 篇文章 24 订阅

订阅专栏

李宏毅机器学习

6 篇文章 1 订阅

订阅专栏

李宏毅机器学习01：机器学习介绍 Introduction

在这里插入图片描述

文章目录

李宏毅机器学习01：机器学习介绍 Introduction

ML Lecture 0-1 Introduction of Machine Learning

一、机器学习步骤

Machine Learning ≈ Looking for a Function

Step 1: define a set of function
Step 2: goodness of function
Step 3: pick the best function

在这里插入图片描述

二、机器学习框架

在这里插入图片描述

三、机器学习学习地图

在这里插入图片描述

(一)Learning Theory

1.Supervised Learning 监督学习

回归Regression

Regression是一种machine learning的task，当我们说：我们要做regression时的意思是，machine找到的function，它的输出是一个scalar，这个叫做regression。举例来说，在作业一里面，我们会要你做PM2.5的预测（比如说预测明天上午的PM2.5），也就是说你要找一个function，这个function的输出是未来某一个时间PM2.5的一个数值，这个是一个regression的问题。
机器要判断function明天上午的PM2.5输出，你要提供给它一些资讯，它才能够猜出明天上午的PM2.5。你给他资讯可能是今天上的PM2.5、昨天上午的PM2.5等等。这是一个function，它吃我们给它过去PM2.5的资料，它输出的是预测未来的PM2.5。

分类Classification

Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值，在Classification里面机器输出的是类别。假设Classification问题分成两种，一种叫做二分类输出的是是或否（Yes or No）；另一类叫做多分类（Multi-class），在Multi-class中是让机器做一个选择题，等于是给他数个选项，每个选项都是一个类别，让他从数个类别里选择正确的类别。

2.Semi-supervised Learning 半监督学习

监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习，我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得，需要人工的力量把它标注出来，这些function的output叫做label。
那有没有办法减少label需要的量呢？就是半监督学习。
假设你先想让机器鉴别猫狗的不同。你想做一个分类器让它告诉你，图片上是猫还是狗。你有少量的猫和狗的labelled data，但是同时你又有大量的Unlabeled data，但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中，这些没有label的data，他可能也是对学习有帮助。这个我们之后会讲为什么这些没有label的data对学习会有帮助。

3.Transfer Learning 迁移学习

另外一个减少data用量的方向是迁移学习。
迁移学习的意思是：假设我们要做猫和狗的分类问题，我们也一样，只有少量的有label的data。但是我们现在有大量的data，这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的，我们要分辨的是猫和狗的不同，但是这边有一大堆其他动物的图片还是动画图片你有这一大堆不相干的图片，它到底可以带来什么帮助。这个就是迁移学习要讲的问题。

4.Unsupervised Learning 无监督学习

更加进阶的就是无监督学习，我们希望机器可以学到无师自通。
如果在完全没有任何label的情况下，到底机器可以学到什么样的事情。举例来说，假设我们今天带机器去动物园让它看一大堆的动物，它能不能够在看了一大堆动物以后，它就学会自己创造一些动物。那这个都是真实例子。仔细看了大量的动物以后，它就可以自己的画一些狗出来。有眼睛长在身上的狗、还有乳牛狗等等。
这个Task也是一个无监督学习的问题，这个function的输入不知道是什么，可能是某一个code代表要输出图片的特性，输出是一张图片。你给机器看到的只有非常大量的图片，只有function的input，没有output。机器要如何生成新的图片，这是我们后面要解决的问题。

5.Reinforcement Learning 强化学习

reinforcement learning是什么呢？在reinforcement learning里面，我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话，他训练的方法会是这样：你就把机器发到线下，让他的和面进来的客人对话，然后想了半天以后呢，最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了，它就要回去自己想道理，是一开始就不应该打招呼吗？还是中间不应该在骂脏话了之类。它不知道，也没有人告诉它哪里做的不好，它要回去反省检讨哪一步做的不好。机器要在reinforcement learning的情况下学习，机器是非常intelligence的。
监督学习：learning form teacher
强化学习：learning form critics

Structured Learning 结构化学习（监督学习中的结构化学习）

structured learning 中让机器输出的是要有结构性的，举例来说：在语音辨识里面，机器输入是声音讯号，输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话，你输入中文希望机器翻成英文，它的输出也是有结构性的。或者你今天要做的是人脸辨识，来给机器看张图片。然后机器要把目标标出来，这也是一个structure learning问题。

其实多数人可能都听过regression，也听过classification，你可能不见得听过structure learning。很多教科书都直接说，machine learning是两大类的问题，regression，和classification。machine learning只有regression和classification两类问题，就好像告诉你：我们所熟知的世界只有五大洲，但是这只是真实世界的一小部分，真正的世界是如图所示。真正世界还应该包括structure learning，这里面还有很多问题是没有探究的。