西瓜书学习笔记二假设空间机器学习周志华

最新推荐文章于 2024-09-16 21:30:36 发布

爱学习的小仙女！

最新推荐文章于 2024-09-16 21:30:36 发布

阅读量424

点赞数 3

分类专栏：机器学习文章标签：笔记机器学习

本文链接：https://blog.csdn.net/XinxingZh/article/details/141198232

版权

机器学习专栏收录该内容

46 篇文章 3 订阅

订阅专栏

1.3 假设空间

归纳(induction) 与演绎(deduction)是科学推理的两大基本手段。前者是从特殊到一般的"泛化" (generalization) 过程，即从具体的事实归结出一般性规律;后者则是从一般到特殊的"特化" (specialization)过程，即从基础原理推演出具体状况。例如，在数学公理系统中，基于一组公理和推理规则推导出与之相洽的定理，这是演绎；而"从样例中学习"显然是一个归纳的过程，因此亦称 "归纳学习" (inductive learning)。

归纳学习有狭义与广义之分，广义的归纳学习大体相当于从样例中学习，而狭义的归纳学习则要求从训练数据中学得概念(concept) ，因此亦称为"概念学习"或"概念形成"。概念学习中最基本的是布尔概念学习，即对"是" "不是"这样的可表示为 0/1 布尔值的目标概念的学习。

例如我们获得了一个这样的训练数据集：

这里要学习的目标是"好瓜"。暂且假设"好瓜"可由"色泽" "根蒂" "敲声"这三个因素完全确定，换言之，只要某个瓜的这三个属性取值明确了，我们就能判断出它是不是好瓜。于是，我们学得的将是"好瓜是某种色泽、某种根蒂、某种敲声的瓜"这样的概念，用布尔表达式写出来则是"好瓜 $\leftrightarrow$ (色泽 =?) ^(根蒂=?) ^ (敲声=?) "，这里 “？” 表示尚未确定的取值，而我们的任务就是通过对表1.1的训练集进行学习，把"?"确定下来。我们学习的目的是“泛化”，即通过对训练集中瓜的学习以获得对没见过的瓜进行判断的能力。

我们可以把学习过程看作一个在所有假设(hypothesis) 组成的空间中进行搜索的过程，搜索目标是找到与训练集"匹配"(fit) 的假设，即能够将训练集中的瓜判断正确的假设。假设的表示一旦确定，假设空间及其规模大小就确定了。这里我们的假设空间由形如"(色泽=?)^(根蒂=?) ^ (敲声=?)"的可能取值所形成的假设组成。