偏差(bias)与方差(variance)

在分析模型的泛化性能时,经常用到偏差和方差。泛化误差可以分解为偏差,方差与噪声之和。



自己的理解:

  1. 偏差:在某算法下期望的预测值与真实的标记(客观存在的标记,而不是数据库人工的标记)度量了学习算法的期望预测与真实结果的偏离程度,刻画了学习算法本身的拟合能力,偏差的主要来之算法本身的拟合能力和数据库的标注误差(最主要来至于算法本身)
  2. 方差:使用相同的样本不同的训练数据集得到的模型的预测值与期望值的差的期望,度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响,表示训练数据的规模导致的预测值与期望值之间误差(理论上数据集无穷大时,模型在该训练数据集的预测值期望值相同,在数据集规模有限时,就会有模型的预测值与期望值存在误差,这个误差的期望反应了数据规模对泛化性能的影响)。

参考
1. http://liuchengxu.org/blog-cn/posts/bias-variance/
2. 《机器学习》周志华

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值