学习西瓜书-公式1.1

最新推荐文章于 2024-04-15 19:29:11 发布

euzmin

最新推荐文章于 2024-04-15 19:29:11 发布

阅读量1k

点赞数 6

分类专栏：学习西瓜书

原文链接：https://www.jianshu.com/p/e1705306f6a3

版权

学习西瓜书专栏收录该内容

2 篇文章 0 订阅

订阅专栏

解释下为什么使用(1.1)式作为“训练集之外的所有样本上的误差”。

首先，我们是这样定义一个假设函数h对一个样本点x的预测误差的：预测值h(x)与真实值f(x)一致则误差为0，不一致则误差为1，即I(h(x)≠f(x))
由于x是一个随机变量，那么这个误差值也是一个随机变量，取值为0或1，其在训练集之外的所有样本上的期望可以看作假设函数h在训练集之外的所有样本上预测的错误率，即：
在这里插入图片描述
我们就把这个错误率作为假设函数h在训练集之外的所有样本上的误差。

然后，在算法La的假设空间中可能会存在多个假设函数与训练集一致，最终产生哪一个是有概率的（这一点我们在以后介绍具体算法时就会看到），令算法La在训练数据集X上产生某个假设h的概率为P(h|X, La)，那么，我们接下来要做的是定义算法La在“训练集之外的所有样本上的误差”，而不只是La产生的一个假设h的误差。

我们已经定义了假设函数h在训练集之外的所有样本上的误差，由于h是算法La以概率P(h|X, La)产生的，那么我们可以定义算法La的误差为所有可能的h的误差的期望，即：
在这里插入图片描述上面的说明就是(1.1)是的含义了。

关注

6
点赞
踩
14

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

euzmin CSDN认证博客专家 CSDN认证企业博客

码龄6年

62: 原创

7万+: 周排名

42万+: 总排名

7万+: 访问

: 等级

991: 积分

50: 粉丝

82: 获赞

37: 评论

267: 收藏

私信

关注

热门文章

分类专栏

计算机基础知识 7篇
linux 6篇
机器学习 7篇
因果推理 7篇
Python 4篇
学习西瓜书 2篇
java初学 15篇
设计模式 4篇
错误合集 1篇
ssm 1篇
CSP真题 1篇
PAT甲级 21篇

最新评论

学习西瓜书-公式1.1
euzmin: 1/（样本空间-训练空间）是假定了所有样本中x的值都不相同吧，但x是随机变量的值，没有这个假设。你可以看看独立同分布和随机采样的相关知识，或许有助于你的理解:)
学习西瓜书-公式1.1
ShadderSeina: 无法理解，这个x不是属于（样本空间-训练空间）的子集吗，从子集选择数据不应该就是平均的1/（样本空间-训练空间）？
Mac 使用 vscode 写 latex
品味科技: mactex 有5个G，这个真的要下载吗？
Mac 使用 vscode 写 latex
euzmin: 你的观点是错误的。首先，本人不是一个教育者，写博客是用于记录和分享，不是教你解决问题，我也没有义务教你，因此不存在误人子弟的情况。其次，这篇博客是我用vscode搭建latex环境的记录，在本地已能成功运行，这已达成了本博客的目的。最后，如果你觉得我写的不好，没有解决你的问题，你可以提出你的疑问或者自己找更好的答案，而不是如此低质量的评价。
Mac 使用 vscode 写 latex
demo_13: 自己都没有学会就出来误人子弟了你就是典型

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。