一、过拟合、欠拟合
1、过拟合和欠拟合是什么
-
(1)当我们训练模型时,发现模型在训练集效果很好,但是在测试集效果不好的时候,模型便可能发生过拟合现象。
-
(2)而训练集和测试集效果均不好的情况则可能发生欠拟合。
2、如何解决过拟合
- (1)首先从数据本身角度去考虑,可以考虑增加训练集样本数量等方式,或者使用GAN等方法来生成新样本数据。
- (2)再从模型本身考虑,降低模型的复杂度,或者在模型中加入正则化等等方法。
- (3)集成学习也是有效的,减少单个模型过拟合的风险。
2.1、什么原因会导致过拟合
- (1)没有加入一些缓解过拟合的措施,比如正则化,BN、LN等手段
- (2)数据量过少
- (3)训练时间过长也会导致过拟合(这个很重要,美团考过)
3、如何解决欠拟合
- 因为平常现在大多数方法都是用深度学习,那么对深度学习来说,解决欠拟合,就是提高模型的复杂度,提高模型的学习能力;而且使用深度学习本身也能在一定程度上解决欠拟合的问题,毕竟很多特征不需要自己去找,本身就能学习到很多特征。
- 正则化系数设置不当,比如设太高,也可能会造成欠拟合。