【机器学习】理解方差、偏差且其泛化误差的关系

符号涵义
x测试样本
D数据集
y_{D}x在数据集中的标记
yx的真实标记
f训练集 D 学得的模型
f\left ( x;D\right )由训练集 D学得的模型f对 x的预测输出
\bar{f}\left ( x \right )模型f 对x的 期望预测 输出

 

方差

在一个训练集 D上模型 f对测试样本 x的预测输出为 f(x;D), 那么学习算法 f对测试样本 x的 期望预测 为:

上面的期望预测也就是针对 不同 数据集 D, f 对 x的预测值取其期望(平均预测)。

使用样本数相同的不同训练集产生的方差为:

 

偏差

期望预测与真实标记的误差称为偏差(bias), 为了方便起见, 我们直接取偏差的平方:

 

泛化误差

以回归任务为例, 学习算法的平方预测误差期望为:

对算法的期望泛化误差进行分解:

bias-variance-proof

令噪声为零,\varepsilon =y_{D}-y=0,所以红色区域的等于零。

最后剩下 E(f;D)=\varepsilon ^{2}+bias^{2}+var,结果为泛化误差 = 偏差 + 方差 + 噪声

 

偏差、方差、噪声

  1. 偏差:度量了模型的期望预测和真实结果的偏离程度,刻画了模型本身的拟合能力
  2. 方差:度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响
  3. 噪声:表达了当前任务上任何模型所能达到的期望泛化误差的下界,刻画了学习问题本身的难度


图解偏差与方差

 

 低方差高方差
低偏差数据点集中+数据点落在预测点上数据不集中+数据点部分落在预测点上(预测的准确率不高)
高偏差数据点集中+数据点与预测点存在距离(预测不准)数据点不集中+数据点基本不落在预测点上(预测不准)

 

方差和偏差与拟合

拟合程度方差偏差原因解决办法
欠拟合 过高训练不足,偏差主导泛化误差集成学习;加深加迭代;加特征;降低正则化;
过拟合过高 训练过多,方差主导泛化误差降低模型复杂度;加正则惩罚项;加训练集;减特征;提高正则化

 

bias-variance-tradeoff

 

参考:

http://www.cnblogs.com/makefile/p/bias-var.html#fn2

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值