周志华机器学习---详解训练集外误差-学习笔记

本文详细解读了机器学习中训练集外误差的概念,它表示学习算法在训练集以外样本上的预期误差。通过公式Eote(La|X,f)探讨了其计算方式,涉及指示函数、样本空间概率及假设出现的概率。理解关键在于指示函数的真假判断以及对不同假设和样本的求和过程。适合机器学习初学者深入理解模型泛化能力。
摘要由CSDN通过智能技术生成

周志华机器学习---详解训练集外误差-学习笔记

一。含义:

  • 学习算法在训练集之外的所有样本上的误差。

二。算法如下:

在这里插入图片描述

三。公式详解:

  • 用La替代式中的学习算法
  • Eote(La|X,f): 算法La学得的假设在训练集外的所有样本上的误差的期望。
  • Ⅱ(h(x)≠f(x)):指示函数,括号里为真就=1,为假就=0
  • ∑h: 对假设的求和。同一算法对于训练集外(测试集)的不同数据产生的不同的假设,每个假设有不同的概率。
  • ∑x∈χ−X:对于样本空间中每一个训练集外的数据都进行右边的
  • P(x) 即训练数据集中,x出现的概率。
  • P(h|X, La)即, 表示学习算法为La, 训练数据集为X下, 假设h出现的改了。假设可以理解成一个函数或模型,一个样本到结果(好瓜,坏瓜的映射)。
  • f(x)表示真实期望的目标函数。

四。对式子的理解:

在这里插入图片描述

  • Ⅱ(h(x)≠f(x)):表示括号里为真就=1,为假就=0。
  • 所以,若绿框里h(x)≠f(x),所在括的运算为1,绿色框的取值为P(x)*P(h|x, La)。否则,绿色框的值为0。
  • 红框:表示对x属于样本空间且不属于训练集的时,对于每一个x,对绿框的值求和。
  • 黑框:表示对于h的每一个取值,对红框的值进行求和。

ps:机器学习新手一枚,如有错误,敬请指正。

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值