【Google 机器学习笔记】
五、泛化,训练集、测试集与验证集
本节推荐配合观看Google机器学习教程:泛化;训练集和测试集;验证集。
- 泛化【Generalization】:模型依据训练时采用的数据,针对以前未见过的新数据做出正确预测的能力。可以理解为特殊到一般的过程。
- 过拟合【Overfitting】:指创建的模型与训练数据过于匹配,以致于模型无法根据新数据做出正确的预测。如果某个模型尝试紧密拟合训练数据,但却不能很好地泛化到新数据,就会发生过拟合。
- 欠拟合【Underfitting】:指模型没有很好地捕捉到数据特征,不能够很好地拟合数据。
- 测试集【Test set】:数据集的子集,用于在模型经由验证集的初步验证之后测试模型。与训练集和验证集