过拟合与欠拟合
train | 7% | 15% | 20% | 1% |
test | 15% | 10% | 30% | 2% |
high variance | high bias | high variance bias | low variance bias |
欠拟合:high bias 训练不好
欠拟合就是模型没有很好地捕捉到数据特征,不能够很好地拟合数据
解决办法
- 添加其他特征
- 减少正则化参数
过拟合 :high variance 测试不好
模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差。
解决办法
- dropout
- 正则化
- batch normalization
- 增加数据训练量
- 数据清洗