Chapter 5 假设评估

第5章 评估假设

对假设的精度进行经验评估是机器学习中的基本问题。

5.1 估计假设精度

5.1.1 样本错误率和真实错误率

  1. 样本错误率(Sample Error):假设 h 关于目标函数f和数据样本 S 的样本错误率(标记为errorS(h)

    errorS(h)1nxSδ(f(x),h(x))

    其中, n S中样例的数量,而 δ(f(x),h(x)) f(x)h(x) 时为1,否则为0。

  2. 真实错误率(True Error):假设 h 关于目标函数f和分布 D 的真实错误率(标记为errorD(h) h D分布随机抽取实例被误分类的概率:

    errorD(h)PrxD[f(x)h(x)]

5.1.2 离散值假设的置信区间

若要基于某个离散值假设 h 在样本 S 上观察到的样本错误率估计它的真实错误率,其中:

  • 样本 S 包含n个样例,它们的抽取按照概率分布 D ,抽取过程是相互独立的,且不依赖于 h
  • n30
  • 假设 h 在这n个样例上犯了 r 个错误(errorS(h)=rn);
    则,可断言:
    1. 没有其他信息的话, errorD(h) 最可能的值为 errorS(h)
    2. 有大约95%的可能性,真实错误率 errorD(h) 处于下面的区间内:
      errorS(h)±1.96errorS(h)(1errorS(h))n

常数1.96是由95%这一置信度确定的(见《标准正态分布双侧上分位点表》)。

定义 zn 为计算 N% 置信区间是的常数。计算 errorD(h) N% 置信区间的一般表达式为:

errorS(h)±znerrorS(h)(1errorS(h))n

5.2 统计理论基础

5.2.1 二项分布

离散值假设 h n 个样例上犯了 r 个错误的概率服从二项分布:

Pr(X=r)=P(r)=n!r!(nr)!pr(1p)nr

期望: E[X]=np
标准差: σX=np(1p)
对于足够大的 n ,二项分布很接近有同样均值和方差的正态分布。建议只在 np(1p)5 时使用正态分布来近似二项分布。

5.2.2 估计偏差(Estimator Bias)

针对任意参数 p 的估计量 Y 的估计偏差定义为: E[Y]p
若估计偏差为0,称 Y p 的无偏估计量(Unbiased Estimator)。

5.2.3 置信区间(Confidence Interval)

参数 p N% 置信区间是的一个以 N% 的概率包含 p 的区间。
如果随机变量 Y 服从均值为 μ ,标准差为 σ 的正态分布,那么 Y 的任一观察值 y N% 的几率会落入区间: μ±zNσ ,相似地,均值 μ N% 的几率会落入区间: y±zNσ

5.2.4 双侧与单侧边界

由一个有下界 L 和上界 U 100(1α)% 置信区间,可得到一个下界为 L 且无上界的 100(1α2)% 置信区间,同时也可得出一个有上界 U 且无下界的 100(1α2)% 置信区间。

5.3 推导置信区间的一般方法

一般包含一下步骤:
1. 确定基准总体中要估计的参数
2. 定义一个估计量,应选择最小方差的无偏估计量
3. 确定控制估计量的概率分布,包括其均值和方差
4. 通过寻找阈值(上界、下界)确定置信区间

5.4 学习算法比较

假定有 LA LB 两个算法,要确定为了学习一特定的目标函数 f ,平均哪个算法更好。即从一基准实例分布D中抽取包含 n 个样例的训练集合,在所有这样的集合中测量两个算法的平均性能:

ESD[errorD(LA(S))errorD(LB(S))]

其中, L(S) 表示在给定训练数据的样本 S 时,学习算法L输出的假设。
实际的学习算法比较中,只有一个有限的样本 D0 。用下述方法来估计两个算法的错误率差异:
1. 将可用数据 D0 分隔成 k 个相同大小的不相交子集 T1T2Tk 。其大小至少为30;
2. 令 i 从1到 k 循环,做如下操作:
Si{D0Ti}
hALA(Si),hBLB(Si)
δierrorTi(hA)errorTi(hB)
3. 计算

δ¯=1ki=1kδi

δ¯ 可以看作是对 ESD0[errorD(LA(S))errorD(LB(S))] 的估计,其近似的 N% 置信区间可表示为:

δ¯±tN,k1sδ¯

其中, sδ¯ 代表对 δ¯ 所服从的概率分布的标准差的估计,

sδ¯=1k(k1)i=1k(δiδ¯)2


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值