过拟合和欠拟合
用机器学习模型对训练集进行训练,最终可能得到以下三种情况:欠拟合、正常、过拟合。
(图片拷贝自《白面机器学习算法带你去面试》)
欠拟合:是指在训练集上和测试集上表现得都不好的情况
过拟合:是指模型对于训练数据拟合呈过当的情况,而对于测试数据效果不好。
解决过拟合的方法:
1、从数据入手,增加更多的训练集数据。
2、降低模型复杂度,适当降低模型复杂度,结果过拟合。
3、加入正则化项。
4、加Dropout。
5、集成学习方法。
6、减少训练轮数。
解决欠拟合
1、添加特征
2、增加模型复杂程度
3、减少正则化系数