机器学习(二)经验误差与过拟合,评估方法

本文探讨了机器学习中的经验误差与过拟合现象,解释了误差类型和过拟合的原因。介绍了模型评估方法,包括留出法、交叉验证法和自助法,以及如何通过这些方法在实际中选择和调整模型。
摘要由CSDN通过智能技术生成

首先介绍经验误差与过拟合,过拟合现象出现原因,提出在现实生话中如何进行模型评估与选择?顺着提出评估方法、性能度量、比较检验、偏差与方差。

一、经验误差与过拟合

1、错误率:分类错误的样本数占样本总数的比例。精度=1-错误率

2、误差:学习器的实际预测输出与样本的真是输出之间的差异。学习器在训练集上的误差称为训练误差或经验误差,在新样本上的误差称为泛化误差,我们希望得到的是泛化误差小的学习器。然而,我们事先并不知道新的样本,所以并不能直接获得泛化误差,实际做的只有将经验误差最小化。

 3、当学习器把训练样本学得太好的时候,很可能把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质,这样会导致泛化能力降低,这种现象称为“过拟合”或过配,对训练样本的一般性质还没有学好的现象称为“欠拟合”或欠配。造成过拟合最常见的原因是由于学习能力过于强大,以至于把训练样本所包含的不太一般的性质都学到了。而欠拟合是由于学习能力低下造成的。欠拟合容易克服,而过拟合就比较麻烦,我们做的只有“缓建”过拟合,这是无法直接消除的。

理想的模型选择是先对候选模型的泛化误差进行评估,然后选择最小的泛化误差那个,然而前面提到的泛化误差不能直接得到,而经验误差由于过拟合现象的存在而不适合作为标准,那么在现实中如何进行模型评估与选择?

二、评估方法

  对上面提出问题的解决的方法是:通过实验测量来对学习器的

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值