机器学习——监督学习&无监督学习

机器学习定义

  • Tom Mitchell给出了一个更现代的定义:“据说,一个计算机程序从经验E中学习某些类型的任务T和性能度量P,如果它在任务T中的性能(用P度量)随着经验E的提高而提高的话。”
  • 经验E:程序成千上万次的练习得到的经验
  • 任务T:计算机训练时所做的任务
  • 性能度量P:计算机训练完成后做下一次任务完成的概率
    例如:玩跳棋。
    E =下棋的经验
    T =下跳棋的任务。
    P =程序赢得下一场比赛的概率。

简单说,监督学习这个想法是指,我们将教计算机如何去完成任务,而在无监督学习中,我们打算让它自己进行学习。

监督学习

  • 在监督学习中,我们得到一个数据集,并且已经知道我们的正确输出应该是什么样的,知道输入和输出之间存在关系。
  • 其基本思想是,监督学习中,对于数据集中的每个数据, 都有相应的正确答案,(训练集) 算法就是基于这些来做出预测。

监督学习问题分为“回归”问题和“分类”问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们试图预测离散输出的结果。换句话说,我们试图将输入变量映射到离散类别中。

  1. 分类问题。 分类是要预测一个离散值输出。 (0或1)
  2. 回归问题。 即通过回归来预测一个连续值输出

示例1:
根据房地产市场上房屋大小的数据,试着预测它们的价格。价格作为规模的函数是一个连续的输出,所以这是一个回归问题。
我们可以把这个例子变成一个分类问题,我们可以输出房子的“售价是高于还是低于要价”。这里我们根据房价将房屋分为两类。
示例2:
(a)回归- -给定一张人的照片,我们必须根据给定的照片预测他们的年龄
(b)分类-给定一个肿瘤患者,我们必须预测肿瘤是恶性还是良性。

无监督学习

无监督学习,我们没有提前告知这个算法,这些是第一类,这些是第二类,这些是第三类等等,相反我们只是告诉算法,你看。这儿有一堆数据,我不知道这个数据是什么东东,我不知道里面都有些什么类型,叫什么名字,我甚至不知道都有哪些类型,但是,请问你可以自动的找到这些数据中的类型吗?然后自动的 按得到的类型把这些个体分类,虽然事先我并不知道哪些类型,因为对于这些数据样本来说,我们没有给算法一个,正确答案,所以,这就是无监督学习。

  • 无监督学习使我们能够在几乎不知道或根本不知道结果应该是什么样子的情况下解决问题。我们可以从不需要知道变量影响的数据中得到结构。
  • 我们可以根据数据中变量之间的关系对数据进行聚类,从而得到这种结构。
  • 在无监督学习中,没有基于预测结果的反馈。

例子:
聚类:收集100万个不同的基因,并找到一种方法自动将这些基因分组,这些基因在某种程度上与不同的变量(如寿命、位置、角色等)相似或相关。
非聚类:“鸡尾酒会算法”,允许您在混乱的环境中找到结构。(例如,在鸡尾酒会上从一堆声音中辨别出个人的声音和音乐)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值