误差 estimator task3

本文探讨了模型误差的两个主要来源:偏差和方差。偏差是指模型未能准确捕获数据的真实关系,而方差则表示模型在训练数据上的表现好,但在新数据上泛化能力差。对于高偏差(欠拟合),可以通过增加特征输入或采用更复杂的模型来改进;而对于高方差(过拟合),解决方案包括获取更多数据和使用正则化。模型选择的关键在于找到偏差和方差之间的最佳平衡,通过交叉验证来最小化总体误差。
摘要由CSDN通过智能技术生成

误差 estimator
在这里插入图片描述

Error:

1)靶心没有瞄准:bias有偏移
2)瞄准位置但有偏移:variance有偏移

在这里插入图片描述

不同宇宙的f* 不一样
设y=b+w* xcp
简单的model(small variance,large bias)受到data的影响小(分布小,但靶心有差距)
较复杂的model(small bias,large variance)每次的f*都不太一样,但平均下来在靶心附近
Bias E [f * ]=- f,if we average all the f *,is it close to ^f

*What to do with large bias?

  • (underfitting)if your model cannot even fit the training examples, then you have large bias
  • (overfitting)if you can fit the training data, but large error on testing data, then you probably have large variance

*For bias, redesign your model

  • Add more features as input
  • A more complex model

*What to do with large variance

  • More data: very effective but not always practical
  • Regularization: 但是很多时候不一定能做到收集更多的data。可以针对对问题的理解对数据集做调整。比如识别手写数字的时候,偏转角度的数据集不够,那就将正常的数据集左转15度,右转15度,类似这样的处理。
  • 在这里插入图片描述

Model selection
There is usually a trade-off between bias and variance
Select a model that balabces two kinds of error to minimize total error
交叉验证
在这里插入图片描述
n折交叉验证
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值