Task01:机器学习介绍

机器学习介绍

机器学习即让机器具有学习的能力。人工智能(Artificial Intelligence)是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,能实现和人一样聪明。深度学习就是机器学习的其中一种方法。
我们要做的其实是让机器有自己学习的能力,也就我们要做的应该machine learning的方向。就是你就写段程序,然后让机器人变得了很聪明,他就能够有学习的能力。
在这里插入图片描述在机器学习框架的整个过程被分成了三个步骤,第一个步骤就是找一个function,第二个步骤就是让机器衡量一个function好或不好,第三个步骤是让机器有一个自动的方法,挑出最好的function

机器学习相关技术

在这里插入图片描述

监督学习

如果你告诉机器input和output,这就叫监督学习(supervised learning)
(1)回归(Regression)
回归是一种机器学习的任务,即当我们要做回归时,机器找到一个函数,它的输出是一个数值。例如,若要做PM2.5的预测(预测明天上午的PM2.5),也就是说我们要找一个函数,这个函数的输出是未来某一个时间PM2.5的一个数值。
在这里插入图片描述
(2)分类(Classification)
回归和分类的区别就是机器输出的类型是不一样。在回归中机器输出的是一个数值,在分类中机器输出的是类别。
假设分类问题分成两种,一种叫做二分类(Binary Classification),输出的为是或否(Yes/No);另一类叫做多分类(Multi-class),在多分类中是让机器从数个类别里选择正确的类别。
例如,二分类可以鉴别垃圾邮件,将其放到垃圾箱。我们需要一个函数,它的输入是一封邮件,输出为邮件是否为垃圾邮件;多分类可以将网络上各种各样的新闻通过一个函数,输入一则新闻,输出新闻属于哪个类别(经济/体育/政治)。
在这里插入图片描述

迁移学习

假设我们要做猫和狗的分类问题,我们只有少量的有标签的数据。但是我们现在有大量的数据,这些大量的数据中可能有标签也可能没有标签。我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片或者动画图片。迁移学习研究的问题就是这一堆不相干的图片,到底可以带来什么帮助。

半监督学习

监督学习的问题是我们需要大量的训练数据。训练数据告诉我们要找的函数的输入和输出之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器函数的输入和输出是什么。这个输出往往没有办法用很自然的方式取得,需要人工的力量将它标注出来,这些函数的输出叫做标签。
假设若想做一个分类器,让它告诉你图片上是猫还是狗。你有少量的猫和狗的标签数据,但是同时你又有大量的未标签数据,但是你无法告诉机器哪些是猫哪些是狗。在半监督学习的技术中,这些没有标签的数据,它对学习可能也是有帮助的。

无监督学习

无监督学习研究的是机器在完全没有任何标签的情况下,到底可以学到什么样的事情。假设我们带机器去动物园让它看一大堆的动物,它能不能够在看了一大堆动物以后,它就学会自己创造一些动物,仔细看了大量的动物以后,它就可以自己的画一些动物出来,这就是无监督学习研究的内容。

监督学习中的结构化学习

结构化学习中让机器输出的是要有结构性的。例如:在语音识别里面,机器输入是声音讯号,输出是一个句子;或者让机器翻译你说一句话,你输入中文希望机器翻译成英文,它的输出也是有结构性的;或者你想做的是人脸识别,给机器看张图片,它会知道每个人对应是谁。然后机器要把这些东西标出来,这就是结构化学习研究的问题。

强化学习

在监督学习中我们会告诉机器正确答案是什么。但在强化学习中,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是它做的好或不好。
若我们现在要用强化学习的方法来训练一个聊天机器人,训练的方法会是这样:把机器发到线下,让它和进来的客人对话,想了半天以后,最后仍旧勃然大怒把电话挂掉了,那机器就学到一件事情,就是刚才做错了。但是它不知道哪边错了,它就要回去自己去想刚刚哪里做的不好。机器若要在强化学习的情况下学习,那么机器是非常智能的。强化学习也是比较符合我们人类真正学习的情景,在学校里学习老师会告诉你答案,但在真实社会中没人回告诉你正确答案,你只知道你做得好还是做得不好。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值