人工智能里的数学修炼 | 是什么决定了你的学习算法泛化性能?偏差—方差分解(bias-variance decomposition)

一段可以解释学习算法泛化性能的推导过程,要想提升自己模型的预测能力,得先了解这种能力受什么影响

偏差-方差分解可以对学习算法的期望泛化错误率进行拆解,得到清晰明确的错误构成

对于测试样本x,令yDx在数据集中的标记,yx的真实标记,f(x;D)为训练集D上学得模型fx上的预测输出。以回归任务为例
学习算法的期望预测为:

                       F(x) = ED[f(x;D)]

使用样本数相同的不同训练集产生的方差为:

                  var(x) = ED[(f(x;D)-F(x))**2]

噪声为:

                      e**2 = ED[(yD-y)**2]

期望输出与真实标记的差别称为偏差:

                    bias(x)**2 = (F(x)-y)**2

为了便于讨论,假定噪声期望为零,即ED[yD-y] = 0.通过简单的多项式展开合并,可对算法的期望泛化误差进行分解:

E(f;D) = ED[(f(x;D)-yD)**2]
       = ED[(f(x;D)-F(x)+F(x)-yD)**2]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-yD)**2]
         + ED[2(f(x;D)-F(x))(F(x)-yD)]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-yD)**2]
         + 2[ED(f(x;D)-F(x))ED(F(x)-yD)]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-yD)**2]
         + 2[(F(x)-F(x))ED(F(x)-yD)]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-yD)**2]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-y+y-yD)**2]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-y)**2] + ED[(y-yD)**2]
         + 2ED[(F(x)-y)(y-yD)]
       = ED[(f(x;D)-F(x))**2] + ED[(F(x)-y)**2] + ED[(y-yD)**2]
       = bias(x)**2 + var(x) + e**2

上式表明,泛化误差可以分解为偏差、方差和噪声之和。偏差度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力;方差度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响;噪声表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。
偏差-方差分解说明,泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的能力决定的

偏差-方差窘境:
对于给定的学习任务,假定我们能够控制学习算法的训练程度,则在训练不足时,学习器的拟合能力不够强,训练数据的扰动不足以使学习器产生显著变化,此时偏差主导泛化错误率;随着训练程度的加深,学习器拟合能力的增强,训练数据发生的扰动渐渐能被学习器学习到,方差逐渐主导了泛化错误率

参考文献
周志华.机器学习[M].北京:清华大学出版社,2015: 44~46

更多资源下载

微信搜索“老和山算法指南”获取更多下载链接与技术交流群
在这里插入图片描述
有问题可以私信博主,点赞关注的一般都会回复,一起努力,谢谢支持。

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Liangjun_Feng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值