西瓜书第一章

1.1学习算法

机器学习研究的主要内容,就是关于在计算机上从数据中产生模型的算法

1.2基本术语

1.=表示取值为

2.事例(样本):

每条记录关于一个实践或对象的描述

3.属性(特征):

反映实践或对象在某方面的表现或性质

4.属性值:

属性上的取值

5.属性空间:

属性组成的空间,输入空间,样本空间。

6.数据集:

记录的集合

7.特征向量

8.数据集

数据集D={x1,x2,x3,......,xm},表示包含m个数据,每一个数据有d个属性

9.学习,训练,训练数据,训练样本,训练集。假设,真相,真实,学习器

10.标记,预测。

拥有标记信息的事例成为样例,y是所有标记的集合,成为标记空间,输出空间

11.机器学习任务:

(1)标记值类型:离散值(分类,正类,反类;多酚类任务)与连续值(回归)

(2)是否拥有标记信息:监督学习(分类,回归),无监督学习(聚类)

12.聚类,簇,训练样本通常不拥有标记信息

13.泛化能力:

根据已知对未知做尽可能地判断,对未知事物判断地正确与否是泛化能力

14.分布:独立同分布

1.3假设空间

1.归纳与演绎

归纳:特殊到一般的泛化,从样例中学习

演绎:一般到特殊的特化,基础原理推演

2.搜索方法:

自顶向下:由一般到特殊

自底向上:由特殊到一半

3.版本空间:

存在一个与训练集一致的假设集合

1.4归纳偏好

1.奥卡姆剃刀:选择简单的算法

2.没有免费的午餐定理

初稿:2024.1.17,于山西吕梁

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值