李宏毅深度学习（一）

最新推荐文章于 2024-05-28 14:29:23 发布

黑小板

最新推荐文章于 2024-05-28 14:29:23 发布

阅读量2.1k

点赞数 1

分类专栏：深度学习文章标签：机器学习深度学习

原文链接：https://datawhalechina.github.io/leeml-notes/#/

版权

深度学习专栏收录该内容

8 篇文章 7 订阅

订阅专栏

Task01 机器学习介绍
本次学习基于李宏毅老师的《机器学习》课程：https://www.bilibili.com/video/av59538266
笔记参照Datawhale开源学习笔记：https://datawhalechina.github.io/leeml-notes/#/
本次学习内容较为基础，适合新手了解学习。

1、机器学习介绍

人工智能(AI)、Artificial Intelligence这个词汇，在1950年代就有了，但直到1980年代有了机器学习方法以后才开始兴旺发展。特别是2010年代以后，随着计算机硬件能力的提升以及深度学习框架的发展，各行各业开始应用或关注AI给生活和生产带来的改变，从而掀起了AI热潮。
人工智能，机器学习，深度学习他们三者的关系是什么呢？人工智能是我们想要达成的目标，机器学习是想要达成这个目标的手段，而深度学习就是机器学习的其中一种方法。
在这里插入图片描述
所谓Machine Learning，就是你就写段程序让机器具有自己学习的能力，而并不是写程序让机器直接做到这件事。假设你要叫他学会做语音辨识，你就告诉它这段声音是“Hi”，这段声音就是“How are you”，这段声音是“Good bye”。希望接下来它就学会了，你给它一个新的声音，它就可以帮你产生语音辨识的结果。
在这里插入图片描述
如果讲的更本质一点，Machine Learning所做的事情，就是在寻找一个function，让机器具有一个能力，这种能力是根据你提供给他的资料，它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需要一个function。
在这里插入图片描述
Machine Learning可以概括的分为三步，就好像是说把大象放进冰箱一样。第一个步骤就是找一系列function，第二个步骤让machine可以衡量一个function是好还是不好，第三个步骤是让machine有一个自动的方法，有一个好演算法可以挑出最好的function。
在这里插入图片描述

2、机器学习相关技术

下图是本次学习的Learning Map。其中蓝色的方块，指的是学习的情景，通常学习的情景是你没有办法控制的。比如，因为我们没有data做监督学习，所以我们才做reinforcement learning。红色的方块，指的是要解的问题，你要解的这个问题随着你用的方程的不同，有regression、有classification、有structured。所以在不同的情境下，都有可能要解这个task。绿色的方块，指的是解决问题所用的方法或模型。
在这里插入图片描述

2.1 监督学习

监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习，我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得，需要人工的力量把它标注出来，这些function的output叫做label。
在这里插入图片描述
Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值，在Classification里面机器输出的是类别。

2.2 半监督学习

监督学习需要大量的label，那有没有办法减少label需要的量呢？假设你先想让机器鉴别猫狗的不同。你想做一个分类器让它告诉你，图片上是猫还是狗。你有少量的猫和狗的labelled data，但是同时你又有大量的Unlabeled data，但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中，这些没有label的data，他可能也是对学习有帮助。
在这里插入图片描述

2.3 迁移学习

另外一个减少data用量的方向是迁移学习。迁移学习的意思是：假设我们要做猫和狗的分类问题，我们也一样，只有少量的有label的data。但是我们现在有大量的data，这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的，我们要分辨的是猫和狗的不同，但是这边有一大堆其他动物的图片甚至动画图片。它到底可以带来什么帮助，这个就是迁移学习要讲的问题。
在这里插入图片描述

2.4 无监督学习

更加进阶的就是无监督学习，我们希望机器可以学到无师自通。如果在完全没有任何label的情况下，到底机器可以学到什么样的事情。举例来说，如果我们给机器看大量的文章（在去网络上收集站文章很容易，网络上随便爬就可以）让机器看过大量的文章以后，它到底可以学到什么事情。
在这里插入图片描述

2.5 结构化学习

在machine要解的任务上我们讲了Regression、classification，还有一类的问题是structured learning。structured learning 中让机器输出的是要有结构性的，举例来说：在语音辨识里面，机器输入是声音讯号，输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话，你输入中文希望机器翻成英文，它的输出也是有结构性的。
在这里插入图片描述

2.6 强化学习

reinforcement learning是什么呢？在reinforcement learning里面，我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话，他训练的方法会是这样：你就把机器发到线下，让他的和面进来的客人对话，然后想了半天以后呢，最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了，它就要回去自己想道理，是一开始就不应该打招呼吗？还是中间不应该在骂脏话了之类。它不知道，也没有人告诉它哪里做的不好，它要回去反省检讨哪一步做的不好。机器要在reinforcement learning的情况下学习，机器是非常intelligence的。 reinforcement learning也是比较符合我们人类真正的学习的情景，这是你在学校里面的学习老师会告诉你答案，但在真实社会中没人回告诉你正确答案。你只知道你做得好还是做得不好，如果机器可以做到reinforcement learning，那确实是比较intelligence。
在这里插入图片描述

黑小板

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
李宏毅深度学习（一）

Task01 机器学习介绍本次学习基于李宏毅老师的《机器学习》课程：https://www.bilibili.com/video/av59538266笔记参照Datawhale开源学习笔记：https://datawhalechina.github.io/leeml-notes/#/本次学习内容较为基础，适合新手了解学习。1、机器学习介绍人工智能(AI)、Artificial Intelligence这个词汇，在1950年代就有了，但直到1980年代有了机器学习方法以后才开始兴旺发展。特别是201
复制链接

扫一扫