validation_curve()的位置
在之前,此函数位置在sklearn.learning_curve.validation_curve(),现在,此函数的位置在sklearn.model_selection.validation_curve()。
validation_curve()的作用
我们知道误差是由偏差(bias)、方差(variance)、噪声(noise)组成。
偏差:模型对于不同的训练样本集,预测结果的平均误差
方差:模型对于不同训练样本集的敏感程度
噪声:数据集本身的一项属性
同样的数据,(cos函数上的点加上噪声),我们用同样的模型(polynomial),但是超参数却不同(degree =1,4,15),会得到不同的拟合效果:
第一个模型太简单,模型本身就拟合不了这些数据(高偏差,underfitting);
第二个模型可以看成几乎完美地拟合了数据;
第三个模型完美拟合了几乎所有的训练数据,但却不能很好的拟合真实的函数,也就是对于不同的训练数据很敏感(高方差,overfitting)。
对于以上第一和第三个模型,我们可以选择模型和超参数来得到效果更好的配置,也就是可以通过验证