西瓜书学习笔记（一）

最新推荐文章于 2024-09-30 18:05:50 发布

记忆力衰退来写博客的李同学

最新推荐文章于 2024-09-30 18:05:50 发布

阅读量4.1k

点赞数 6

分类专栏：西瓜书笔记文章标签：机器学习读书

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Cyril__Li/article/details/70599621

版权

西瓜书笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这本书一共16章，大体分为三部分：

第一部分：1-3章，介绍机器学习基础知识
第二部分： 4-10章，介绍经典而常用的机器学习方法
第三部分：11-16章，介绍一些进阶知识
其中前三章之后各部分内容相对独立。

第一章绪论

样本空间：

训练集为样本空间的一个很小的采样，通常我们假设样本空间中全体样本服从一个未知分布D,我们获得的每个样本都是独立地从这个分布上采样获得的，即独立同分布（i. i. d.），即训练样本越多我们得到的关于D的信息越多。

假设空间：

把学习过程看作为一个在所有假设组成的空间中进行搜索的过程，搜索目标是找到与训练集“匹配”的假设。

例如：
书中判断好瓜坏瓜的例子，有三个属性：色泽，根蒂，敲声，分别有3，3，2种取值，另外还有可能某个取值无影响，即取任何值都无所谓，用“*”表示，另外还有可能根本不存在好瓜，这样子得到的假设空间大小为4*3*3+1=37。

在这个假设空间中，可能有多个假设和训练集一致，我们称之为“版本空间”

归纳偏好

在版本空间中该选则哪一个假设？这时我们必须有某种偏好。

例如：
在回归问题中，存在多条曲线与有限样本训练集一致，即有多条曲线穿过样本点，如果我们偏好“更简单的假设”，则意味着我们会选择更平滑的曲线。

但是，“没有免费的午餐”定理（NFL）告诉我们，脱离具体问题，空谈“什么算法更好”毫无意义，在某些问题上表现好的在另一些问题上不一定好。

记忆力衰退来写博客的李同学

关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。