机器学习

机器学习
1.定义
Arthur Samuel :是计算机无需明确编程即可学习的学习领域。(过时的定义)
Tom Mitchell:如果某计算机程序在T任务上的性能(由P衡量)随着经验E的提高而提高,则可以说计算机程序可以从经验E中学习一些任务T和性能度量P。
问题1:假设你的邮件程序观察你将哪些邮件标记为垃圾邮件,因此在这样的一个邮箱客户端,你可能标记其中一些邮件为垃圾邮件而其他的不标记,基于你标记的垃圾邮件,你的邮件程序学会了如何更好的过滤垃圾邮件。在这个事件中,任务T、经验E、标准P分别是什么?
显然,
任务T就是判断邮件是否是垃圾邮件
经验E就是用户判断邮件是否使垃圾邮件
指标P就是判断邮件是垃圾邮件正确的概率
2.监督学习与无监督学习
监督学习中,我们得到了一个数据集,并且知道了正确的输出是什么样子,并且认为输入和输出之间存在关系。
监督学习分为回归和分类问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们改为尝试预测离散输出中的结果。也就是,我们尝试将输入变量映射为离散类别。
范例1:
给定有关房地产市场上房屋大小的数据,请尝试预测其价格。价格作为规模的函数是一个连续的输出,因此这是一个回归问题。
对于患有肿瘤的患者,我们必须预测肿瘤是恶性还是良性的。我们将输入变量预测为离散类别,因此这是一个分类问题。

无监督学习使我们事前不用了解结果是什么样子,仅仅需要将数据集输入,就可以自动的根据数据中隐藏的结构对数据集进行分类。
比如,
聚类算法:收集1000000个不同基因的集合,然后找到一种方法,将这些基因自动分组为通过不同变量(例如寿命、位置、角色等)在某种程度上相似或相关的组。
非集群算法:在一个派对中从混乱的声音里识别出个人的声音或某种特定的音乐。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值