在建模的过程中会经常出现1.模型的效果,但是泛化能力弱,2.模型的结果很差的情况,即过拟合和欠拟合,一下是总结的学习笔记
1.1欠拟合
欠拟合现象:模型准确率低
欠拟合原因:模型没有很好地捕捉到数据特征,不能够很好地拟合数据,
欠拟合解决方法:
1)特征项不够增加特征项。例如,'拉长时间',‘’变量组合‘’、“特征泛化”、“相关性”等
2)添加多项式特征,这个在机器学习算法里面用的很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。
3)减少正则化参数,正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合,则需要减少正则化参数。
1.2过拟合
过拟合现象:在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳。模型的泛化能力较弱
过拟合原因:1.训练数据不够,即训练数据无法对整个数据进行评估,2.对模型过度训练
解决方法:
1ÿ