关于训练误差、测试误差、泛化误差

最新推荐文章于 2025-05-04 09:19:12 发布

原创最新推荐文章于 2025-05-04 09:19:12 发布

· 2.6w 阅读

·

31

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#训练误差 #测试误差 #泛化误差

机器学习同时被 2 个专栏收录

25 篇文章

订阅专栏

17 篇文章

订阅专栏

我们在学习模式识别的时候，总是会遇到一些专业词汇，而其中有的专业词汇叫人傻傻分不清。

今天我就来说说训练误差、测试误差、泛化误差到底是什么，区别所在。

对于分类学习算法，我们一般将样本集分为训练集和测试集，其中训练集用于算法模型的学习或训练，而测试集通常用于评估训练好的模型对于数据的预测性能评估。而这个先后顺序就是先将算法在训练集上训练得到一个模型，然后在测试集上评估性能。

这个时候我们通常要考虑评估的这个性能是否合理。由于测试学习算法是否成功在于算法对于训练中未见过的数据的预测执行能力，因此我们一般将分类模型的误差分为训练误差（Training Error）和泛化误差（Generalization Error）。那么这两个误差到底是什么呢？

训练误差是指模型在训练集上的错分样本比率，说白了就是在训练集上训练完毕后在训练集本身上进行预测得到了错分率

（同样的测试误差就是模型在测试集上的错分率）

泛化误差是指模型在未知记录上的期望误差，说白了就是在训练集上没见过的数据的错分样本比率。

因此在样本集划分时，如果得到的训练集与测试集的数据没有交集，此时测试误差基本等同于泛化误差。

因此以上就是三者的意义所在和区别所在！！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。