Basic Concept

Where does the error come from?

越复杂的model不见得会带给你越低的error
error主要来源于 bias(偏差)variance(方差)
了解了error的来源有助于采取适当的方法来improve你的model

Bias and Variance of Estimator

均值、方差、样本估计总体、无偏估计、矩估计、中心极限定理…(概率论
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
个人理解:偏差看距离点远近,方差看点的分散程度;点越集中,方差越小;离中心越远,偏差越大。(射击的
Simpler model is less influenced by the sampled(样品) data
在这里插入图片描述
直观解释:简单的model的function space比较小,可能根本没有包含靶心target,所以bias比较大;而复杂model的function space大到可以包含很多地方,可能包含了这个target,但他无法找出这个target,因为提供的training data不够。
在这里插入图片描述
总结:简单的model有比较大的bias和比较小的variance;复杂的model的bias比较小但variance比较大(和training data拟合更好,但不适用于testing data)。如果这个error来自于large variance则称为overfitting;如果这个error来自于large bias则称为underfitting

What to do with large bias?

在这里插入图片描述
underfitting:你的model无法拟合training data,那你可能有较大的bias
overfitting:你的model可以拟合training data,但在testing data上有较大的error,那你可能有较大的variance

要想处理bias,需要重新设计你的model:

  • 在input里增加新的features
  • 设计一个更复杂的model

What to do with large variance?

在这里插入图片描述

  • 收集更多的data(非常有效,但很多时候无法实现)
  • regularization(但是可能会增大这个model的bias)

Model Selection

在这里插入图片描述
在bias和variance间取得平衡,选择一个对training data和testing data的error都最小的model
除非你的testing set比较好地代表了总体分布,否则实际使用时Err一定会变差
可以进行交叉验证,把训练集拆分成训练集和验证集

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值