偏差-方差分解

对于测试样本 x \bm{x} x,令 y D y_{D} yD x \bm{x} x在数据集中的真实标记, f ( x ; D ) f(\bm{x};D) f(x;D)为训练集 D D D
学得模型 f f f x \bm{x} x上的预测输出。以回归问题为例,学习算法的期望预测为:
f ‾ ( x ) = E D [ f ( x ; D ) ] \overline{f}(x)=E_{D}[f(\bm{x};D)] f(x)=ED[f(x;D)]
使用样本数相同的不同的训练集产生的方差为:
v a r ( x ) = E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] var(\bm{x})=E_{D}[(f(\bm{x};D)-\overline{f}(x))^2] var(x)=ED[(f(x;D)f(x))2]
噪声为:
ε 2 = E D [ ( y D − y ) 2 ] \varepsilon^2=E_{D}[(y_D-y)^2] ε2=ED[(yDy)2]
期望输出与真实标记的差别称为偏差:
b i a s 2 ( x ) = ( f ‾ ( x ) − y ) 2 bias^2(\bm{x})=(\overline{f}(x)-y)^2 bias2(x)=(f(x)y)2
假定噪声的期望为0,即 E D [ y D − y ] = 0 E_D[y_D-y]=0 ED[yDy]=0,下面对算法的期望泛化误差进行分解:
E ( f ; D ) = E D [ ( f ( x ; D ) − y D ) 2 ] E(f;D) = E_D[(f(\bm{x};D)-y_D)^2] E(f;D)=ED[(f(x;D)yD)2]
= E D [ ( f ( x ; D ) − f ‾ ( x ) + f ‾ ( x ) − y D ) 2 ] =E_D[(f(x;D)-\overline{f}(x)+\overline{f}(x)-y_D)^2] =ED[(f(x;D)f(x)+f(x)yD)2]
= E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] + E D [ ( f ‾ ( x ) − y D ) 2 ] + E D [ 2 ( f ( x ; D ) − f ‾ ( x ) ) ( f ‾ ( x ) − y D ) ] =E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y_D)^2]+E_D[2(f(x;D)-\overline{f}(x))(\overline{f}(x)-y_D)] =ED[(f(x;D)f(x))2]+ED[(f(x)yD)2]+ED[2(f(x;D)f(x))(f(x)yD)]
= E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] + E D [ ( f ‾ ( x ) − y + y − y D ) 2 ] =E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y+y-y_D)^2] =ED[(f(x;D)f(x))2]+ED[(f(x)y+yyD)2]
= E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] + E D [ ( f ‾ ( x ) − y ) 2 ] + E D [ ( y − y D ) 2 ] + 2 E D [ ( f ‾ ( x ) − y ) ( y − y D ) ] =E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y)^2]+E_D[(y-y_D)^2]+2E_D[(\overline{f}(x)-y)(y-y_D)] =ED[(f(x;D)f(x))2]+ED[(f(x)y)2]+ED[(yyD)2]+2ED[(f(x)y)(yyD)]
= E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] + ( f ‾ ( x ) − y ) 2 + E D [ ( y D − y ) 2 ] =E_D[(f(x;D)-\overline{f}(x))^2]+(\overline{f}(x)-y)^2+E_D[(y_D-y)^2] =ED[(f(x;D)f(x))2]+(f(x)y)2+ED[(yDy)2]
= b i a s 2 ( x ) + v a r ( x ) + ε 2 =bias^2(x)+var(x)+\varepsilon^2 =bias2(x)+var(x)+ε2

偏差:学习算法的期望预测与真实结果的偏离程度
方差:数据扰动所造成的影响
噪声:表达了当前任务上任何学习算法所能达到的期望泛化误差的下界

参考:西瓜书

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值