CS229课程笔记9:分类问题的Bias-Variance分解,经验风险最小化

基于least square的bias-variance分解十分常见

E(y^y)2=E(y^Eτy^+Eτy^y)2=E(y^Eτy^)2+E(yEτy^)2=Var(y^)+Bias2(y^,y)

其中 y^ 为预测值, y 为真值,E(x) x 基于数据真实分布的期望,Eτ(x) x 对训练集τ的期望。
对于分类问题,平方差误差并不常作为criterion,Ng给出了一个直观上的Bias-Variance分解,基于经验风险(Empirical Risk)的目标函数。首先严格探讨了方程集有限的情况,然后给出了方程集合无限的直观理解。

Empirical Risk Minimization (ERM)

给出定义:
存在某个备选方程集合 H={h1,h2,,hk} ,其中每个 hi 都是从 Rn {0,1} 的映射。
每一个方程的风险定义为 ϵ(h)=Ex,y1{(h(x)y}=P(x,y)D(h(x)y)
经验风险是风险基于训练集的估计,其定义为

ϵ^(h)=1mi=1m1{h(xi)yi}

经验风险最小化即求取 h^=argminhHϵ^(h)

方程集有限的情况 |H|<

定义 h=argminhHϵ(h) ϵ(h) 取决于方程集与数据分布,不受训练集控制,视为bias。而 h^ 是训练得到的 h 的近似, ϵ(h^) ϵ(h) 之间的差异视为variance,是由训练集采样引入的。即对 ϵ(h^) 进行分解,得到 ϵ(h) 是bias,差异值视为variance。

1. ϵ^(h) VS ϵ(h)

假设 ϵ(h)=Ex,y1{(h(x)y}=P(x,y)D(h(x)y)=p , 则有 ϵ^ ϵ 之间实际为采样误差。

定义 zi=1{h(xi)yi} ,则有 ziB(p) ,即符合概率为 p 的伯努利分布。而ϵ^(h)=1mmi=1zi符合采样数为 m 概率为p的二项式分布(根据定义),从而有 E(ϵ^(h))=ϵ(h) Var(ϵ^(h))=mϵ(h)(1ϵ(h))

基于Hoeffding不等式,我们有 P(|ϵ(h)ϵ^(h)|>γ)2exp(2γ2m)

2. h ϵ^(h) VS ϵ(h)

P(hH,|ϵ(h)ϵ^(h)|γ)=P(¬h|ϵ(h)ϵ^(h)|>γ)                                                      =1P(h|ϵ(h)ϵ^(h)|>γ)                                                            1P(|ϵ(h)ϵ^(h)|>γ)×|H|                                        =12kexp(2γ2m)

3. ϵ^(h^) VS ϵ(h)

ϵ(h^)ϵ^(h^)+γ         ϵ^(h)+γ          ϵ(h)+2γ

其中第一个和第三个不等式由 P(hH,|ϵ(h)ϵ^(h)|γ)12kexp(2γ2m) 引入,第二个不等式由 h^=argminhHϵ^(h) 引入。第一个和第三个不等式同时成立的概率至少为 (12kexp(2γ2m))2 ,即两者不相关。

值得注意的是这是一个比较宽泛的上限,给出的更多是直观的指导性意见。因为不等式推导过程中并没有使用 h=argminhHϵ(h) 这个条件,所以对于任意 h ,均有ϵ(h^)ϵ(h)+2γ。根据此指导性意见,可以推出一个采样复杂度的概念,即需要多少训练样本才能保证 ϵ(h^) ϵ(h) 足够小。结论如下:

m=O(1γ2logkδ)

其中 γ |ϵ(h^)ϵ(h)|/2 ,即能够忍受的最大误差值的一半; k=|H| 即方程集大小; 1δ 为置信率,即上诉不等式成立的概率。注意到通常情况下 γ δ 的设定在同一个问题下保持稳定,所以采样数量是方程集大小的对数函数,随模型复杂度增长缓慢。

方程集无限的情况 |H|

Ng首先给出了一个直观上易于理解但是不严谨的证明:设模型参数个数为 d ,每个都是用64bit表示的浮点数,所以方程集大小实际是有限的, k=|H|264d ,进而 m=O(d) ,即采样率与参数个数是线性关系。这也符合实际情况。

严格的证明是基于VC维的,结论是类似的:设 d H的VC维,

P(|ϵ(h)ϵ^(h)|O(dmlogmd+1mlog1δ))1δϵ(h^)ϵ(h)+O(dmlogmd+1mlog1δ)

进而 m=O(d) ,在 δ γ 固定的情况下。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值