【无标题】

Task 1机器学习认知

1、三个概念

人工智慧:让机器具有像人一样的智慧

机器学习:让机器具有学习的的能力

深度学习:机器学习的一种方法

三者之前呈现一个包含关系,人工智慧是我们最终想要达成的目标,是我们理想状态,而如何达成这样的目标,需要我们通过机器学习(包含深度学习)的手段来完成,可以说,前者是目标,后者相当于工具,有了工具就能更好地达成目标。

2、机器行为

生物的行为取决于两个方面:一是先天本能,二是后天学习

同理可得要想改变机器的行为,我们必须也从这两方面入手。

生物的先天本能和后天学习的行为我们都很好理解,比如人的本能眨眼睛,我们后天学习到的写字,走路做饭等等,那么机器的先天本能和后天学习我们该如何理解?

**机器的先天本能:**人为设置的限定条件/规则(hand-crafted rules),相当于一些初始值,限定了一些机器初始的行为。

**机器的后天学习:**机器通过进行一定的训练得到的不属于自己先天本能的额外能力,如模型经过数据集的训练,就可以对未知的数据进行一定的预测,如房价预测,个性化推荐

2.1先天本能局限性

hand-crafted rules 的坏处使用hand-crafted rules你没办法考虑到所有的可能性,它非常的僵化。

机器学习的先天本能是由人为设置,由于刚开始人为思考的不全面导致的设置初始规则的不全面则会导致那机器的先天本能也会是不全面的。

所以如果机器只是按照人为设置的规则去行动的话,那他永远也无法超越创造出他的人类。

2.2如何解决这个局限性?

  1. 人为想出尽可能多的可能性,从而设置大量的初始规则。

缺点:需要大量的人力资源,一起进行想象,成本太高效率太低,也不方便。

  1. 让机器利用数据训练,自动构建规则。

这也是机器学习的目的,只要有数据进行训练,就可以实现,大大降低了门槛,有利于中小企业发展。

例:**语音辨识:**通过给机器人右侧的训练录音数据,当他听到右侧新的录音时,他可自动知道这段录音所要表达的意思,这样就不用每次不同录音都需要一次设定规则,增加了机器应对未知情况的能力。
请添加图片描述

下面这个例子也是如此:图片识别在这里插入图片描述

总的来说是要让机器具有自动学习的能力,这也是AI目前研究方向

3、机器学习的过程

机器学习所做的事情,我们可以想成就是在寻找一个function。机器通过前期我们所提供的数据找到这个function,从而根据这个function来预测新的情况。

为什么不人为寻找function?

如果人为寻找这个function,太过复杂,工作难度较大,难以实行。

机器学习的步骤:

在这里插入图片描述

在这里插入图片描述

  1. 准备一个function set(集合),也就是模型。
  2. 输入训练资料(input)进行训练,使得机器找到最优规则/关系
  3. 通过找到的最优规则去识别新的数据,从而给出结果(output)
function的好坏

function的好坏取决于输入和输出结果对应是否正确,如果能够对应,我们就说这个function是好的,反之亦然。

在这里插入图片描述

既然function有好坏,那这一个function set中肯定有不好的function,要想最终得到一个好的结果,我们必须排除不好的function,但仅仅这样是不够的,我们需要更近一步的划分,从function set选取最好的function,这样最后的结果才是最好的。

那如何找到最优的function?

我们需要一个有效率的演算法,有效率的演算法可以从function的set里面挑出最好的function。

4、机器学习的相关技术

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ySD064MY-1641840554639)(C:\Users\zhangshilang\AppData\Roaming\Typora\typora-user-images\image-20220111014901135.png)]

4.1、监督学习

*定义:根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。也就是说,在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。

监督问题可以分为三类:回归问题、分类问题和强化学习。

4.11 regression(回归)问题

定义:Regression是一种machine learning的task,当我们说:我们要做regression时的意思是,machine找到的function,它的输出是一个scalar(数值),这个叫做regression。

例:检测PM2.5,房价预测

4.12 Classification(分类)问题

在Classification里面机器输出的是类别

**二分类:**输出的是是或否(Yes or No) 例:鉴别垃圾邮件

**多分类:**将训练资料按不同类别进行分类 例:新闻分类

4.13、监督学习中的强化学习

在监督学习中我们会告诉机器正确答案是什么,但在强化学习里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好,他会依次找出自己做的不好的原因。

机器输出的是要有结构性的

例:Alpha Go

模型也分为两种:**线性和非线性 **,深度学习模型就是最典型的非线性模型。

在做Deep learning时,它的function是特别复杂的,所以它可以做特别复杂的事情。比如它可以做影像辨识,这个复杂的function可以描述pixel(像素)和class之间的关系。Deep learning的技术也可以让机器下围棋, 下围棋这个task 其实就是一个分类的问题,我们可以把它想成是一个十九乘十九个类别的多分类问题。

监督学习的问题:我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系,我们需要告诉机器function的input和output是什么,但是output无法用自然的方式获得,需要人工标注,比较麻烦。

这些function的output叫做label

4.2、半监督学习

为了减少label的量,可以用半监督学习.一部分数据被标记,一部分没有。

4.3、迁移学习

4.4、无监督学习

定义:我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。

在没有标签label的情况下,希望机器可以自学,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值