第一章习题

最新推荐文章于 2023-03-01 11:25:52 发布

计算机视觉从零学

最新推荐文章于 2023-03-01 11:25:52 发布

阅读量1.2k

点赞数

分类专栏：西瓜书文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/weixin_43889476/article/details/118499363

版权

西瓜书专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.1 表1.1中若只包含编号为1和4的两个样例，试给出相应的版本空间。
在这里插入图片描述
答：从一般到特殊或是从特殊到一般对整个假设空间进行搜索，删除与正例1不一致的假设，或与反例4一致的假设，最终得到版本空间为：
（1）色泽=青绿根蒂=蜷缩敲声=浊响
（2）色泽=青绿根蒂=蜷缩敲声= *
（3）色泽=青绿根蒂=* 敲声=浊响
（4）色泽= * 根蒂=蜷缩敲声=浊响
（5）色泽=青绿根蒂= * 敲声= *
（6）色泽= * 根蒂=蜷缩敲声= *
（7）色泽= * 根蒂= * 敲声=浊响

在这里插入图片描述
1.2 与使用单个合取式来进行假设表示相比，使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间，试估算有多少种可能的假设。

答：表1.1包含3种属性，它的假设空间大小为3×4×4+1=49
考虑冗余情况：
具体假设 2×3×3=18种
一个属性泛化假设 2×3+3×3+2×3=21种
两个属性泛化假设 2+3+3=8种
三个属性泛化假设 1种
不考虑冗余、空集的情况下k最大取值为48，考虑冗余的情况下k最大取值为18
k=1时，共48种
k=18时，共1种
k取中间值，比较复杂。

1.3 若数据包含噪声，则假设空间中有可能不存在与所有训练样本都一致的假设。在此情形下，设计一种归纳偏好用于假设选择。

答：（1）最简单的设计：训练样本一致特征越多越好，即一致性比例越高越好，为归纳偏好。考虑归纳偏好应尽量与问题相匹配，所以可使归纳偏好与噪声分布相匹配。
（2）通常认为两个数据的属性越相近，则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类，则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据，留下的数据就是没误差的数据，但是可能会丢失部分信息。

1.5 试述机器学习能在互联网搜索的哪些环节起作用。

答：消息推送，如广告推荐；网站排名；图片搜索。

计算机视觉从零学

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
第一章习题

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码
复制链接

扫一扫