机器学习入门术语

本文内容整理自周志华机器学习,机器学习研究的主要内容:在计算机中从数据中产生“模型 model”的算法,即“学习算法 learning algorithm”。
Tom Mitchell关于机器学习的定义:假设用性能度量 P 来评估计算机程序在某类任务的性能,若一个程序通过利用经验 E 在任务 T 中改善其性能,我们就说关于性能度量 P 和任务 T,程序对经验 E 进行了学习。
Tom Mitchell原话:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E

拗口的定义,自我理解:计算机程序在对经验 E的学习过程中,提高了任务 T 的性能度量指标P。
机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”(model)的算法,即学习算法(learning algorithm)。

入门术语

示例 (instance) 或样本 (sample):关于一个事件或对象的描述(数据记录)
数据集 (data set):一组记录的集合
属性 (attribute) 或特征 (feature):反映事件或对象在某方面的表现或性质的事项
假设 (hypothesis):学习模型对应了关于数据某种潜在的规律
标签 (标记、label):示例结果的信息
样例 (example):拥有标记信息的示例

学习任务分类:
根据训练数据是否拥有标记信息,学习任务分为两大类:监督学习(supervised learning)和无监督学习(unsupervised learning)。
在监督学习中,数据包含输出变量或标记,主要任务是分类和回归。
分类 (classification):预测结果是离散值的学习任务
回归 (regression):预测结果是连续值的学习任务
在无监督学习中,数据不包含输出变量或标记,而其主要任务是发掘模式。
聚类 (clustering):将物理或抽象对象的集合分成由类似的对象组成的多个类的过程

ml

大数据时代三大关键技术:机器学习、云计算、众包(crowdsourcing)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值