机器学习入门教学——过拟合、欠拟合、模型验证、样本拆分

恣睢s

已于 2023-09-11 16:55:34 修改

阅读量280

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

于 2023-09-09 16:13:20 首次发布

本文链接：https://blog.csdn.net/weixin_45100742/article/details/132777629

版权

14 篇文章 2 订阅

订阅专栏

平均绝对误差MAE
误差
绝对误差
平均绝对误差

假设，有一组数据，我们使用这组数据训练了一个模型。然后我们再用这组数据来对该模型进行验证，如计算平均绝对误差，结果表示模型质量良好。
这样计算出的得分被称为“样本内”分数，因为我们完全依托于样本进行分析和预测，并且预测的结果也是样本中给出的。结果自然显得准确（因为模型学习到了该数据集的所有可能性），但遇到新的数据可能会产生问题。
所以我们要将手头的数据进行拆，可以拆分成训练数据、验证数据和测试数据。
- 训练数据负责训练模型，练数据集占数据集的大部分比例,一般占60%~80%。
- 验证数据负责验证模型对新数据的准确性，一般占数据集的10%~20%。
- 测试数据负责测试最终模型的性能指标。这部分数据完全独立，不可用于训练，以得到最终的模型评估。一般占数据集的10%~20%。