问题描述:在做特征工程并训练模型的过程中,可能会出现过拟合(高方差)或者欠拟合(高偏差)的情况,怎么判定我们的模型所处的状态呢。
是什么:
是一个用来判定 1添加更多的训练数据给我们带来多大的收益
2模型是否处在过拟合/欠拟合的状态
例子:
![](https://i-blog.csdnimg.cn/blog_migrate/9b15286c603f01761e0fafc2dab68800.png)
通过上图可以看出,随着训练样本增加,Training score 在降低,而cross-validation score 在增加,说明模型的泛化性能在提高,而当两者收敛到一个较低的值时,再添加训练样本,模型的泛化性能趋于稳定,说明继续增加训练样本并不能带来更多的泛化性能的收益。
怎么用: