【机器学习】什么是机器学习?

本文为机器学习的学习总结。

机器学习的定义

Tom Mitchell 提出:计算机程序从经验 E 中学习,解决某一任务 T T T,进行某一性能度量 P P P,通过 P P P 测定在 T T T 上的表现,因经验 E E E 而提高。

我们举个例子来说明以上定义。例如你要在邮箱中标记邮件是否为垃圾邮件,计算机程序对你的行为进行了学习。此时, T , E , P T, E, P T,E,P 分别如下:

  • T T T:将邮件分类为垃圾邮件或非垃圾邮件;
  • E E E:观察你将邮件标记为垃圾邮件还是非垃圾邮件的行为;
  • P P P:正确归类邮件的比例。

监督学习

我们首先用一个例子来引入。假设你拿到了北京市的房屋出售价格与房屋大小的几组数据:

在这里插入图片描述

如果你的房子是大小是 750,那么你的房子能卖多少钱呢?

在这里,我们可以使用一条直线对已有的数据进行拟合,再找出横坐标为 750 时对应的出售价格。当然你也可以使用二次或者三次函数进行拟合。那么我们该用什么样的方式进行拟合就是一个监督学习的例子。

因此我们可以把监督学习的定义概括如下:给算法一部分正确答案集,我们需要给出更多的正确答案。用更专业的术语就是,这是一个回归问题,我们想要预测连续的输出(在此我们将房屋售价看作连续值)。

我们再举另一个例子。我们得到了乳腺癌恶性良性与肿瘤大小的关系如图:

在这里插入图片描述

如果有一位病人的肿瘤大小如紫色箭头所示,那么她的肿瘤是良性的还是恶性的呢?这是一个分类问题,因为是一组离散的输出值。同理,我们也可以有 2 种以上的输出值,如肿瘤的不同类型(类型 I,类型 II……)。此时的关系图可以表示为最下面的横轴形式,其中不同标记表示了不同的类型:

在这里插入图片描述当然,我们要研究的问题还可能有多个特征,例如年龄。这时关系图的表示如下:

在这里插入图片描述

如果这位病人的年龄和肿瘤大小数据在粉色圆点处,那么我们可以用一条黑色的直线分隔开不同的输出类型,从而判断出病人的肿瘤类型。

同理,我们可以处理更多的特征,甚至无穷多的特征。因为计算机的内存可能溢出,我们应该如何处理这种情况呢?支持向量机则提供了这种情况的处理算法,这一部分我们将在后面进行介绍。

无监督学习

在前面的监督学习的例子中,对于每个样本都有其确定的类型:

在这里插入图片描述

在无监督学习中,则没有确定的类型,我们需要对给定数据集进行学习,从而找到其中的某种结构:

在这里插入图片描述

用无监督学习的算法可以学习到该数据集具有两个簇,分别在左下角和右上角,这种算法被称为聚类算法

我们具体用一个例子来进行解释。下图中每一列代表一个个体每一行代表个体所拥有的基因组程度,在这里我们给定每个个体的基因组,需要对个体根据基因组程度进行分类。分类结果间图上方的大括号:

在这里插入图片描述

我们再举另一个典型的例子,这个问题被称为鸡尾酒宴会。在一个屋子中有一个宴会,大家同时互相说话。我们对情景进行简化,屋子中只有两个人和两个麦克风,但每个麦克风离每个人的距离不同,换句话说就是当两个人同时说话时,麦克风听到的两个人声音大小不同,麦克风记录了两个人重叠的声音。

在这里插入图片描述

无监督学习算法会发现两个听起来相似的音频叠加在一起才有了这样的效果,并对两个不同的音频进行分类。

这样看似一个十分复杂的问题,如果你使用了合适的软件进行编程,可能真的只需要几行代码。在本例中,我们在 Octave 中编程只需要一行代码便可实现这样的功能:

[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

当然使用 Matlab 也可以用简单的程序解决这个问题。但如果你用了 C++、Java 或 Python,你也许不得不链接例如音频库等很多库,编写大量的代码才能实现这一功能。所以,我们最好选择使用 Octave。

关于机器学习的定义就介绍到这里啦,后面将进行线性回归模型的学习。一起加油吧 😃

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值