机器学习（二）西瓜书笔记

最新推荐文章于 2024-03-04 14:45:57 发布

weixin_38996229

最新推荐文章于 2024-03-04 14:45:57 发布

阅读量154

点赞数

分类专栏：机器学习文章标签：机器学习概念理解西瓜书

本文链接：https://blog.csdn.net/weixin_38996229/article/details/83176367

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

归纳（induction）和演绎（deduction）是科学推理的两大基本手段

归纳：从特殊到一般的泛化（generalization）的过程，即从具体事实归结出一般性规律

演绎：从一般到特殊的特化（specialization）过程，即从基础原理推演出具体状况

归纳学习有狭义和广义之分

广义的归纳学习：相当于从样例中学习

狭义的归纳学习：从训练数据中学得概念（concept），因此亦称为概念学习或概念形成

概念学习中最基本的是布尔概念学习，即对“是”“不是”这样的可表示为0/1布尔值的目标概念的学习。

表1.1 西瓜数据集
编号	色泽	根蒂	敲声	好瓜
1	青绿	蜷缩	浊响	是
2	乌黑	蜷缩	浊响	是
3	青绿	硬挺	清脆	否
4	乌黑	稍蜷	沉闷	否

西瓜问题的版本空间

现实问题中我们常面临很大的假设空间，但学习是基于有限样本训练集进行的，因此，可能有多个假设与训练集一致，即存在一个与训练集一致的“假设集合”，我们称之为版本空间（version space）。例如，在西瓜问题中，表1.1训练集所对应的版本空间就是图1.2。

问题记录：

1、对于版本空间其实不是很理解，这需要在学习中慢慢理解。

机器学习算法在学习过程中对某种类型假设的偏好，称为“归类偏好（inductive bias）”或简称为偏好。举例，若我们的算法喜欢“尽可能特殊”的模型，则它会选择“好瓜 $\leftrightarrow$ （色泽=*） $\wedge$ （根蒂=蜷缩） $\wedge$ （敲声=浊响）”；但是若算法喜欢“尽可能一般”的模型，则它会选择“好瓜 $\leftrightarrow$ （色泽=*） $\wedge$ （根蒂=蜷缩） $\wedge$ （敲声=*”）”。

“奥卡姆剃刀（OCCam‘s razor’）”是一种常用的、自然科学研究中最基本的原则，即“若有多个假设与观察一致，则选最简单的那个”。

无论学习算法 $\pounds _{a}$ 多聪明、学习算法 $\pounds _{b}$ 多笨拙，他们的期望性相同。这就是“没有免费的午餐原理（No Free Lunch Theorem，NFL）”

weixin_38996229

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（二）西瓜书笔记

归纳（induction）和演绎（deduction）是科学推理的两大基本手段归纳：从特殊到一般的泛化（generalization）的过程，即从具体事实归结出一般性规律演绎：从一般到特殊的特化（specialization）过程，即从基础原理推演出具体状况归纳学习有狭义和广义之分广义的归纳学习：相当于从样例中学习狭义的归纳学习：从训练数据中学得概念（concept），因此亦称...
复制链接

扫一扫

专栏目录