机器学习（二）经验误差与过拟合，评估方法

最新推荐文章于 2023-06-19 10:05:54 发布

IMWTJ

最新推荐文章于 2023-06-19 10:05:54 发布

阅读量1.9k

点赞数 1

分类专栏：机器学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/IMWTJ123/article/details/79923756

版权

本文探讨了机器学习中的经验误差与过拟合现象，解释了误差类型和过拟合的原因。介绍了模型评估方法，包括留出法、交叉验证法和自助法，以及如何通过这些方法在实际中选择和调整模型。

摘要由CSDN通过智能技术生成

首先介绍经验误差与过拟合，过拟合现象出现原因，提出在现实生话中如何进行模型评估与选择？顺着提出评估方法、性能度量、比较检验、偏差与方差。

一、经验误差与过拟合

1、错误率：分类错误的样本数占样本总数的比例。精度=1-错误率

2、误差：学习器的实际预测输出与样本的真是输出之间的差异。学习器在训练集上的误差称为训练误差或经验误差，在新样本上的误差称为泛化误差，我们希望得到的是泛化误差小的学习器。然而，我们事先并不知道新的样本，所以并不能直接获得泛化误差，实际做的只有将经验误差最小化。

3、当学习器把训练样本学得太好的时候，很可能把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质，这样会导致泛化能力降低，这种现象称为“过拟合”或过配，对训练样本的一般性质还没有学好的现象称为“欠拟合”或欠配。造成过拟合最常见的原因是由于学习能力过于强大，以至于把训练样本所包含的不太一般的性质都学到了。而欠拟合是由于学习能力低下造成的。欠拟合容易克服，而过拟合就比较麻烦，我们做的只有“缓建”过拟合，这是无法直接消除的。

理想的模型选择是先对候选模型的泛化误差进行评估，然后选择最小的泛化误差那个，然而前面提到的泛化误差不能直接得到，而经验误差由于过拟合现象的存在而不适合作为标准，那么在现实中如何进行模型评估与选择？

二、评估方法

对上面提出问题的解决的方法是：通过实验测量来对学习器的

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习（二）经验误差与过拟合，评估方法

首先介绍经验误差与过拟合，过拟合现象出现原因，提出在现实生话中如何进行模型评估与选择？顺着提出评估方法、性能度量、比较检验、偏差与方差。一、经验误差与过拟合1、错误率：分类错误的样本数占样本总数的比例。精度=1-错误率2、误差：学习器的实际预测输出与样本的真是输出之间的差异。学习器在训练集上的误差称为训练误差或经验误差，在新样本上的误差称为泛化误差，我们希望得到的是泛化误差小的学习器。然而，我们事...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。