Table of Contents
一、 过拟合
(一) 来源说明
参数越多,模型越复杂,越容易导致过拟合。
(二) 表现
模型在训练集上表现效果(AUC、Acc等指标)远远优于测试集,即泛化能力差。
(三) 过拟合处理,解决办法
1. 增加更多训练数据
2. 减小训练数据的噪声
(1)修改数据错误
(2)去除异常值
3. 简化模型
(1)选择更少参数模型,如用线性模型,而不用高阶多项式模型。
(2)进行特征选择、降维。
(3)限制模型:增加正则化。
二、 欠拟合
(一) 来源说明
(二) 表现
(三) 欠拟合处理,解决办法
1. 选用带更多参数的复杂模型。
2. 进行特征工程,用更好的特征训练学习算法。
3. 减少对模型的限制,如减少正则化超参数。