机器学习第一章

本文概述了机器学习基础知识,包括数据集、样本与属性的定义,监督与无监督学习的区别,以及泛化能力的重要性。深入探讨了假设空间,解释其由特定条件构成的假设元素,并介绍了版本空间的概念,它是与训练集一致的假设集合。此外,讨论了归纳偏好的概念,如奥卡姆剃刀原则和NFL定理。
摘要由CSDN通过智能技术生成

机器学习 周志华

1 绪论

1.2 基本术语

数据集、样本、属性、属性值、输入空间

训练集、测试集、验证集、输出空间

监督学习、分类、回归;无监督学习、聚类

泛化能力

1.3 假设空间、版本空间

  假设空间:“由输入空间到输出空间的映射的集合”。也就是由输入空间 X 到输出空间 Y 的映射 f : X -> Y 所构成的集合,该空间是一个函数空间,即由函数所构成的集合。

   第5页,“这里我们的假设空间由形如‘(色泽=?) ∩ \cap (根蒂=?) ∩ \cap (敲声=?) ​’的可能取值所形成的假设组成”

  假设空间的一个元素就是 “色泽为a根蒂为b敲声为c的瓜是好瓜” 这么个假设。这里a,b,c都已经固定4个取值。再加上不存在好瓜这么个假设。一共 4 × 4 × 4 + 1 = 65 4\times4\times4+1=65 4×4×4+1=65 个元素。

  里面并不同时存在 色泽=1,根蒂=2,敲声=3 和 色泽=2,根蒂=3,敲声=1 都是好瓜的情况,因为这种情况无法决策。

  版本空间:“版本空间就是与训练集一致的所有假设所构成的集合”。也就是版本空间内的每个元素(假设),都与训练集不冲突。版本空间是假设空间的子集。

1.4 归纳偏好

机器学习算法在学习过程中对某种假设类型的偏好,称为假设偏好。

奥卡姆剃刀原则:若有多个假设与观察一致,则选择简单的那个。

简单也不不同的诠释。简单也没有统一的标准。

没有免费午餐定理。(NFL定理)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值