第一课 机器学习的动机与应用

一:机器学习的定义

Arthur Samuel 1959年(亚瑟·塞穆尔)的定义: Field of study that gives computers the ability to learn without being explicitly programmed.
【在没有明确为计算机编写(完成某项具体任务的)程序的情况下,让计算机拥有 “学习” 能力的一个研究领域。】

Tom Mitchell 1998年的定义: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
【如果一个计算机程序在任务 T 上的性能度量 P ,通过经验 E 而提高,那么我们称这个计算机程序通过经验 E 来学习。】

二:课程分类

(1)supervised Learning (监督学习)
(2)Learning Theory (学习理论)
(3)Unsupervised Learning (无监督学习)
(4)Reinforcement Learning (强化学习)

2.1 supervised Learning (监督学习)

从标记的训练数据来推断一个功能的机器学习任务。
为算法提供了一组数据与“标准答案”,让算法去学习标准输入与标准答案之间的联系,以尝试对于我们的其他输入,给我们提供更加标准的答案。

分类:

  1. 回归问题

以房屋面积(Size in feet²)和房价(Price)为例

这里写图片描述

采集了一组房屋面积和对应房价的正确数据,我们采用直线或者二次函数去拟合这组数据,我们的目的是当给出一个新的房屋面积时,可以计算出更正确的房价

  1. 分类问题
    —变量是离散而不是连续的。

    以肿瘤大小(Tumor Size)和肿瘤是否为恶性(maligant为恶性记为1,benign为良性记为0)为例

    这里写图片描述

同样目前我们搜集了一组肿瘤大小和其是否为良性的数据,这是一组为0或者为1的离散值,我们的目的是当有一个新的肿瘤时,可以根据它的大小将其进行正确分类。
在上面这个例子中,我们判断肿瘤是否为良性是依靠肿瘤大小。然而在实际生活中,单凭这一个特征是无法正确分类的,可能还需要参考患者年龄、肿块厚度、细胞大小的一致性、细胞形状的一致性等等很多输入量。
例如当我们有两个特征:肿瘤大小和患者年龄 时,可以得到下图:(X表示恶性肿瘤,O表示良性肿瘤)

这里写图片描述

我们找到一条直线将不同性质的肿瘤分开,当有一个新的肿瘤时,就可以根据其大小以及患者年龄进行更正确的分类。
那当我们有更多的特征变量时,我们无法在二维,三维甚至任何有限维空间中表示出来,当这个数据是一个无限维时,要如何处理?
此时,就可以使用一个被称为支持向量机的算法,这个算法可以把数据映射到无限维空间中。

2.2 Unsupervised Learning (无监督学习)
给一组数据,但并不告诉我们所谓的“标准答案”,即数据无标记。无监督学习的任务就是在这组数据中找结构。

在Unsupervised Learning中,我们只是得到了一组数据,但并不知道这些数据代表什么意思,(如下图)这时就要求我们要自己找到这些数据中存在何种结构,有什么特点。

以肿瘤为例

这里写图片描述

对于给定的数据集,Unsupervised Learning Algorithm可能判定该数据集包含两个不同的聚类。无监督学习算法会把这些数据分成两个不同的聚类,这就是所谓的聚类算法

聚类算法的例子:
鸡尾酒宴问题

想象一下,一个宴会有一屋子的人,大家都坐在一起,并且在同时说话,因此会有许多声音混杂在一起,因为许多人会在同一时间说话,在这种情况下你很难听清楚你面前的人说的话。

因此,比如有这样一个场景,宴会上只有两个人,两个人同时说话(恩,没错…这是个很小的鸡尾酒宴会),我们准备好了两个麦克风,把它们放在房间里,然后因为这两个麦克风距离这两个人的距离是不同的,每个麦克风都记录下了来自两个人的声音的不同组合。

这里写图片描述

我们能做的就是把这两个录音输入一种无监督学习算法中,称为“鸡尾酒会算法”。让这个算法帮你找出其中蕴含的分类,然后这个算法就可以去识别这些录音,分离出这两个被叠加到一起的音频源

鸡尾酒会问题(Cocktail Party Problem),在一个满是人的房间中,人们都在互相对话,我们使用一些麦克风录下房间中的声音,利用非监督学习算法来识别房间中某一个人所说的话。

对图像进行处理
一张图片使用聚类算法,它会学习对这些像素进行聚类

2.3 强化学习

它可以被用在你需要进行一系列决策时。需要找到一种方式来定义你想要什么,你如何定义一个好的行为和一个坏的行为,之后就需要一个学习型算法来尽可能地获得更多的回报和更少的惩罚。
强化学习把学习看作试探评价过程,Agent选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给Agent,Agent根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。

应用于机器人领域,无人机等。。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值