周志华西瓜书《机器学习》课后习题 ------ 第一章绪论

最新推荐文章于 2022-10-21 21:18:31 发布

小啊小木头

最新推荐文章于 2022-10-21 21:18:31 发布

阅读量1.1k

点赞数 4

分类专栏：机器学习文章标签：西瓜书周志华机器学习课后习题绪论

本文链接：https://blog.csdn.net/lxfHaHaHa/article/details/89439702

版权

西瓜书课后习题个人理解
总目录：https://blog.csdn.net/lxfHaHaHa/article/details/89439640

1.1 表1.1中若只包含编号为1，4的两个样例，试给出相应的版本空间

先把样表给写出来，只取 1 和 4 两条数据

编号	色泽	根蒂	敲声	好瓜
1	青绿	蜷缩	浊响	是
2	乌黑	稍蜷	沉闷	否

这里要理解三个概念：样本空间、假设空间 和 版本空间。

样本空间：所获得的数据集。
假设空间：所有可能性的集合。如有 $n$ 个属性，第 $i$ 种属性有 $x_i$ 种选择，那么假设空间的数量就是 $\prod _{1}^{n}(x_i+1)+1$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小啊小木头

关注关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

西瓜书（周志华）：什么是版本空间以及如何求取版本空间

花花的博客

03-06

2万+

下面是自己结合百度的资料来理解的一些比较通俗的说法：假设空间：属性所有可能取值组成的可能的样本版本空间：与已知数据集一致的所有假设的子集集合。（绿色加号代表正类样本，红色小圈代表负类样本） GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary),； SB 是最大精确正假设边界(maximally Speci

机器学习-西瓜书-课后题-第一章

IRISQP的博客

11-10

910

# 机器学习-西瓜书-课后题-第一章 ### 习题1.1 表1.1中若只包含编号为1和4的两个样例，试给出相应的版本空间。 ![20201110-105635(eSpace).png](http://image.huawei.com/tiny-lts/v1/images/7f2d5272f1abd44bfeef_783x242.png@900-0-90-f.png) 如果只包含1和4样例，那么三个属性的取值都只有两个色泽：青绿，乌黑根蒂：蜷缩，稍蜷敲声：浊响，沉闷如果我们用A来每种属性的第一个值，B

参与评论您还未登录，请先登录后发表或查看评论

机器学习（周志华）课后习题

paintShadow的博客

10-21

8695

机器学习记录

《机器学习》周志华第一章课后习题

huzimu_的博客

03-06

3510

机器学习第一章课后习题答案 1.1 先区分两个概念，假设空间和版本空间。假设空间是指所有的可能的情况所形成的假设组成的集合，而版本空间则是对假设空间进行搜索，删除与正例不一致的假设和与反例一致的假设，所得到的与训练集一致的假设组成的集合。对于表 1.1，若色泽、根蒂、敲声分别有3种取值，假设空间大小是（3 + 1）^ 3 + 1 = 65，第一个 1 代表任意，即该特征对是否是好瓜无影响，第二个 1 代表空集，即没有“好瓜”这种概念（如果仅考虑表中的特征，那应该是344+1 = 49）。版本空间大小是

《机器学习》(周志华)课后习题参考答案

qq_31688497的博客

10-08

3332

https://blog.csdn.net/kchai31/article/details/78966941

周志华-机器学习-西瓜书-1-9章习题解析.docx

01-01

该文档整理了CSDN上的机器学习-周志华-西瓜书的一到九章的习题解析，方便大家免费下载

西瓜书《机器学习》-第二章模型评估与选择代码实现.zip

最新发布

10-19

1、选取某UCI分类数据集，划分数据集，用10折交叉验证，选用两个现成的分类算法（或者一个算法、参数不同），得到分类模型A和B，给出交叉验证预测结果。 2、对两模型的交叉验证预测结果，分别给出混淆矩阵、P、R和F1...

机器学习-西瓜书笔记汇总1

08-03

1绪论傍晚小街路面上沁出微雨后的湿润，和熙的细风吹来，抬头看看天边的晚霞，嗯，明天又是一个好天气。走到水果摊旁，挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜，一边满

周志华《机器学习》课后习题个人解答

01-30

周志华《机器学习》课后习题个人解答。各算法都拿numpy和pandas实现了一遍

西瓜书课后习题——第一章

weixin_30263073的博客

04-11

384

1.1 若表中只包含编号1和4两个样例，则训练数据集为色泽根蒂敲声是否好瓜青绿蜷缩浊响是乌黑稍蜷沉闷否上表有三个属性，每个属性有两种取值，所以上述数据集的假设空间大小为3*3*3+1=28 编号色泽根蒂敲声与训练集正例是否一致 1 青绿 ...

《机器学习》周志华课后习题答案——第二章（1-4题已完结）

weixin_45626630的博客

11-18

1万+

《机器学习》周志华课后习题答案——第二章（更新中）文章目录《机器学习》周志华课后习题答案——第二章（更新中）一、数据集包含1000个样本,其中500个正例、500 个反例，将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式.二、数据集包含100个样本,其中正、反例各占一半,假定学习算法所产生的模型是将*新样本预测为训练样本*数较多的类别(训练样本数相同时进行随机猜测)，试给出用10折交叉验证法和留一法分别对错误率进行评估所得的结果.三、若学习器A的 F1值比学习器

西瓜书学习课后题 —— 第1章绪论

创可不能贴的博客

05-14

431

第1章习题： 1. 表1.1中若只包含编号为1，4的两个样例，试给出相应的版本空间。编号色泽根蒂敲声好瓜 1 青绿蜷缩浊响是 4 乌黑稍蜷沉闷否假设空间共：(2+1)×（2+1）×（2+1）+1 = 28 种版本空间： 1. 色泽 = 青绿，根蒂 = 蜷缩，敲声 = 浊响 2. 色泽 = 青绿，根蒂 = 蜷缩，敲声 = * 3. 色泽 =...

机器学习（周志华）课后作业/习题答案

热门推荐

Mr_Cat123的博客

01-23

2万+

前言：本作业系笔者通过个人思考、参考博文、引擎搜索、查阅资料等各种途径完成，因此必然有解答不当之处。故本系列答案仅仅作为笔者个人笔记使用（相当于笔者的在线笔记本，因此仅一家之言）。此外笔者只完成部分认为有用的问题。持续更新中… 第一章 1.1 通常情况下，版本空间是正例的泛化。在我们确定学习目标之后（比如找到“好瓜”，视为正例），可能有多个假设（hypothesis）是跟我们的目标一致的，满足...

《机器学习》周志华课后习题答案——第四章 (1-5已完结)

weixin_45626630的博客

11-24

1万+

《机器学习》周志华课后习题答案一第四章 (1-5已完结) 文章目录《机器学习》周志华课后习题答案一第四章 (1-5已完结)一、试证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为 0)的决策树.二、试析使用“最小训练误差”作为决策树划分选择准则的缺陷.三、试编程实现基于信息熵进行划分选择的决策树算法,并为表4.3中数据生成一棵决策树.四、试编程实现基于基尼指数进行划分选择的决策树算法,为表4.2中数据生成预剪枝、后剪枝决策树,并与未剪枝决策树进行比较.五、试编程实

《机器学习》周志华课后习题答案——第五章（1-7已完结）

weixin_45626630的博客

11-01

1万+

第五章课后习题答案文章目录第五章课后习题答案一、试述将线性函数f(x) = wTx用作神经元激活函数的缺陷？二、试述使用图5.2(b)激活函数的神经元与对率回归的联系三、对于图5.7中的Vih,试推导出BP算法中的更新公式(5.13). 一、试述将线性函数f(x) = wTx用作神经元激活函数的缺陷？使用线性函数作为激活函数时，因为在单元层和隐藏层，其单元值仍是输入值X的线性组合。若输出层也用线性函数作为激活函数，达不到“激活”与“筛选”的目的，这样相当于整个的线性回归。二、试述使用图5.2(b

西瓜书课后答案第一章

weixin_43260483的博客

11-05

2115

第一章 1.版本空间：（1）色泽=青绿根蒂=蜷缩敲声=浊响（2）色泽=青绿根蒂=蜷缩敲声=* （3）色泽=青绿根蒂=* 敲声=浊响（4）色泽=* 根蒂=蜷缩敲声=浊响（5）色泽=青绿根蒂=* 敲声=* （6）色泽=* 根蒂=蜷缩 ...

西瓜书课后习题涉及的知识点-第一章

lwycc2333的博客

07-23

275

习题1.1 假设空间：所有假设组成的空间，学习的过程可以看作一个在假设空间中进行搜索的过程，搜索的目标是找到与训练集匹配的假设。版本空间：一个与训练集一致的“假设集合”。也就是说针对某个有限的训练集，版本空间里的每一个假设，都是与训练集符合的。...

机器学习周志华课后题第三章

04-06

1. 什么是泛化能力？泛化能力和过拟合之间有什么关系？泛化能力是指模型在新的、未见过的数据上的表现能力。模型的泛化能力与其对训练数据的拟合程度有关，通常来说，过拟合的模型泛化能力较差。 2. 什么是交叉验证？交叉验证的作用是什么？交叉验证是一种通过将数据集分成若干个子集来进行模型评估的方法。具体地，将数据集分成k个子集，每个子集都轮流作为测试集，其余子集作为训练集，重复k次，最终得到k个模型的评估结果的平均值。交叉验证的作用是提高模型评估的可靠性和泛化能力。 3. 留出法、k折交叉验证和留一法的区别是什么？它们各自适用于什么情况？留出法是将数据集分成两部分，一部分作为训练集，另一部分作为测试集。留出法适用于数据集较大的情况。 k折交叉验证是将数据集分成k个子集，每个子集都轮流作为测试集，其余子集作为训练集，重复k次，最终得到k个模型的评估结果的平均值。k折交叉验证适用于数据集较小的情况。留一法是k折交叉验证的一种特殊情况，即将数据集分成n个子集，每个子集都作为测试集，其余子集作为训练集，重复n次。留一法适用于数据集较小且样本数较少的情况。 4. 为什么要对数据进行预处理？数据预处理的方法有哪些？数据预处理可以提高模型的表现，并且可以减少过拟合的风险。数据预处理的方法包括：标准化、归一化、缺失值填充、特征选择、特征降维等。 5. 什么是特征选择？特征选择的方法有哪些？特征选择是指从所有特征中选择出对模型预测结果有重要贡献的特征。特征选择的方法包括：过滤式方法、包裹式方法和嵌入式方法。其中，过滤式方法是基于特征间的关系进行特征选择，包裹式方法是基于模型的性能进行特征选择，嵌入式方法是将特征选择嵌入到模型训练中。

周志华 西瓜书 《机器学习》课后习题 ------ 第一章 绪论

1.1 表1.1中若只包含编号为1，4的两个样例，试给出相应的版本空间

周志华西瓜书《机器学习》课后习题 ------ 第一章绪论