本质:模型的复杂度,太复杂就过拟合,太简单就欠拟合
怎么发现过拟合、欠拟合:离线验证集指标反弹,在线效果下降。
过拟合:
1 增加训练样本数量
2 增加正则系数大小,drop out 也是一种正则方案。
降低树的深度。
3 模型集成
欠拟合:
1 增加特征
2 模型复杂度还可以通过增加高次项实现
3 减小正则化系数
思考:结合自身业务来谈谈以上问题
本质:模型的复杂度,太复杂就过拟合,太简单就欠拟合
怎么发现过拟合、欠拟合:离线验证集指标反弹,在线效果下降。
过拟合:
1 增加训练样本数量
2 增加正则系数大小,drop out 也是一种正则方案。
降低树的深度。
3 模型集成
欠拟合:
1 增加特征
2 模型复杂度还可以通过增加高次项实现
3 减小正则化系数
思考:结合自身业务来谈谈以上问题