1、泛化能力:是指机器学习算法对新鲜样本的适应能力。 学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。通常通过测试误差来评价学习方法的泛化能力。
2、欠拟合:泛化能力弱,做了很多题,始终掌握不了规律,不管遇到老题新题都不会做;
解决欠拟合的方法:
(1) 增加特征项;
(2) 添加多项式特征;
(3) 减少正则项。
过拟合:泛化能力弱,做了很多题,只会死记硬背,一到考试看到新题就蒙了;
解决过拟合的方法:
(1) 清洗数据;
(2) 增大训练数据量;
(3) 采用正则化方法;
不收敛:完全不做题,考试全靠瞎蒙
过拟合模型在训练过程中产生的损失很低,但在预测新数据方面的表现却非常糟糕
3、泛化误差:反映了学习方法的泛化能力,如果一种方法学习的模型比另一种方法学习的模型具有更小的泛化误差,那么这种方法就更有效
4、提高泛化能力:
1.增加数据量。
2.正则化。
3.凸优化。
交叉验证提出背景(在机器学习里,通常来说我们不能将全部用于数据训练模型,否则我们将没有数据集对该模型进行验证,从而评估我们的模型的预测效果。我们可以把整个数据集分成两部分,一部分用于训练,一部分用于验证,这也就是我们经常提到的训练集(training set)和测试集(test set)。不过,这个