机器学习(1)

基本术语

数据集

对事件或对象的描述的集合

示例/样本

反映事件或对象某方面的表现或属性,例如  色泽=绿色

前者为属性/特征,后者为属性(特征)值

属性张成的空间为属性/样本/输入空间

每个样本在空间中都有唯一的一点表示,对应一个特征向量

一个样本可由多个属性来描述,属性个数就为维度数

学习/训练

从数据到模型的过程

训练数据

训练过程用到的数据

训练样本

数据中的每个样本称为一个训练样本

训练集

训练样本组成

假设

由训练数据中学到的模型(潜在规律)

真相/真实

数据背后隐藏的真实的规律

预测

标记

样本的评价/结果

样例

拥有标记的样本

标记空间

根据标记构建的空间

分类

预测值是离散的

二分类、多分类

回归

预测值是连续的

测试

预测的过程

测试样本

预测用到的样本

聚类

将训练集分成组,每组成为一“簇”

聚类学习中训练样本一般没有标记

学习分类

标准:有无标记信息

监督学习

分类、回归

无监督学习

聚类

学习目标

使模型能够用于新样本

泛化能力

适用于新样本的能力

假设

通常加色样本空间服从一个位置的分布D,每个样本都是从中独立获取的(独立同分布),一般样本越多,莫辛纳甘分化能力越强

假设空间

学习过程可以看作依据训练集从假设空间中删去错误假设的过程

(通常假设空间很大+训练集有限 ==》多个假设)

假设空间

训练集所描述的问题的所有假设组成的集合

假设集合/版本空间

符合训练集中所有样本描述的假设的集合

归纳

特殊到一般,泛化过程

演绎

一般到特殊,特化过程

归纳偏好

一个模型必须要有一个确定的假设来支撑,偏好就是在最终选择使用的假设的倾向性,一种选取假设的原则

参考文献:

周志华. 机器学习

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值