模型评估与模型参数选择

最新推荐文章于 2025-04-20 18:47:26 发布

m0_65652538

最新推荐文章于 2025-04-20 18:47:26 发布

阅读量744

点赞数 12

文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/m0_65652538/article/details/142314974

版权

误差：预测输出结果与真实输出的结果之间的差异

经验误差、训练误差：在训练集上的误差

泛化误差：在新样本上的误差

泛化误差越小越好，经验误差不一定越小越好，可能导致过拟合

3种数据集之间的关系：训练集相当于上课学知识；验证集相当于课后的的练习题，用来纠正和强化学到的知识；测试集相当于期末考试，用来最终评估学习效果

验证集：当我们的模型训练好之后，我们并不知道他的表现如何。这个时候就可以使用验证集（Validation Dataset）来看看模型在新数据（验证集和测试集是不同的数据）上的表现如何。同时通过调整超参数，让模型处于最好的状态。

验证集有2个主要的作用：1、评估模型效果，为了调整超参数而服务 2、调整超参数，使得模型在验证集上的效果最好（说明：验证集不像训练集和测试集，它是非必需的。如果不需要调整超参数，就可以不使用验证集，直接用测试集来评估效果。验证集评估出来的效果并非模型的最终效果，主要是用来调整超参数的，模型最终效果以测试集的评估结果为准。）

划分数据集:对于小规模样本集（几万量级），常用的划分比例：

训练集：验证集：测试集=6：2：2

训练集：测试集==8：2、7：3

对于大规模样本集（百万级以上），只要验证集和测试集的数量足够即可。

超参数越少，或者超参数很容易调整，那么可以减少验证集的比例，更多的分配给训练集。

过拟合：将训练样本自身的一些特点当作所有样本潜在的泛化特点。

产生过拟合的原因：1、训练数据太少（比如只有几百组） 2、模型的复杂度太高（比如隐藏层层数设置的过多，神经元的数量设置的过大） 3、数据不纯

防止过拟合通常可以采取的方法：1、 移除特征，降低模型的复杂度：减少神经元的个数，减少隐藏层的层数 ◦ 2、训练集增加更多的数据 ◦ 3、重新清洗数据 ◦ 4、数据增强 ◦ 5、正则化 ◦ 6、早停

欠拟合：还没训练好。 发生欠拟合的原因：1. 数据未做归一化处理 2. 神经网络拟合能力不足 3. 数据的特征项不够。 解决方法：1. 寻找最优的权重初始化方案 2. 增加网络层数、epoch 3. 使用适当的激活函数、优化器和学习率 4. 减少正则化参数 5. 增加特征