李宏毅《机器学习》任务一

Task01:
参照开源文档,观看视频 P1-2:机器学习介绍(1天)。
视频地址:https://www.bilibili.com/video/av59538266
01-机器学习介绍
02-为什么要学习机器学习

一、概述

人工智能;我们要达成的目标
机器学习:达成目标的手段
深度学习:机器学习的一种方法
人工智能的思想线索:
生物本能——让机器具有本能——人设定规则——if规则(许多if规则)——缺点:无法超越人类智慧
AI的目的是让机器有自己学习的能力,这就是机器学习的方向。
Maching Learning的方向:写段程序,让机器具有学习的能力。
机器学习需要做的事情:根据我们提供给它的资料,机器寻找我们需要的function。
在这里插入图片描述

二、寻找function的过程

   首先准备一个function set(叫做model),接下来利用训练资料,告诉机器好的function是什么样的。但是一个一个训练function太慢,需要一个好的算法,从function set里跳出最好的function,记为f*。然后我们希望再给机器输入一个没有训练过的资料时,机器也能正确识别。

关于机器学习有如下的步骤:
在这里插入图片描述
在这里插入图片描述
第一步:找一个function。
第二步:让机器衡量一个function好还是不好。
第三步:有一个好的算法让机器有办法挑出最好的function。

三、机器学习相关技术

在这里插入图片描述

1 监督学习

Regression(回归):是机器学习的一种任务,例如:输入的是过去的PM2.5,输出的是预测的未来的PM2.5。
Classification(分类):与Regression的区别是,回归问题输出的是一个数值,分类问题输出的是类别。又分为二分类和多分类问题。如判断邮件是否为垃圾邮件是二分类问题,判断新闻类别是教育,政治还是财经类新闻属于多分类问题。
求解任务的方法:
选择不同的function set,也就是选择不同的model。Linear Model最简单,Deep Learning很复杂,但是也可以做很复杂的事情,如训练机器下围棋。
除了深度学习以外,还有很多model也是非线性模型,如SVM。
以上监督学习的任务需要大量的training data,需要告诉机器input和output,其中output需要手工标注出来,即label。要减少标注label的数量,可以采用半监督学习。

2 半监督学习

在这里插入图片描述
你有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。后面会讲到。

3 迁移学习

在这里插入图片描述
假设我们要做猫和狗的分类问题,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是这些data跟我们现在要考虑的问题是没有什么特别的关系的。这些不相关的data对于分类有什么帮助,这是迁移学习要讲的问题。

4 无监督学习

在这里插入图片描述
无监督学习就是让机器无师自通。
这个Task是一个无监督学习的问题,这个function的输入不知道是什么,可能是某一个code代表要输出图片的特性,输出是一张图片。你给机器看到的只有非常大量的图片,只有function的input,没有output。机器要咋样生成新的图片,这是我们后面要解决的问题。

5 监督学习中的结构化学习

在这里插入图片描述
structured learning 中让机器输出的是要有结构性的,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。
machine learning只有regression和classification两类问题,就好像告诉你:我们所熟知的世界只有五大洲,但是这只是真实世界的一小部分,真正的世界是如图所示。真正世界还应该包括structure learning,这里面还有很多问题是没有探究的。

6 强化学习

在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。机器根据每轮的分数来判断自己的行为是好还是不好,然后调整自己的行为,直至到达最好的效果。reinforcement learning也是比较我们人类真正的学习的情景,如果机器可以做到reinforcement learning,那确实是比较intelligence。
在这里插入图片描述
若我们用Alpha Go当做例子时,supervised learning就是告诉机器:看到这个盘式你就下“5-5”,看到这个盘式你就下“3-3”。
Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后再做reinforcement learning。

参考链接
李宏毅机器学习笔记

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值