过拟合出现的原因及解决方案
过拟合出现的原因及解决方案原因训练集的数量级和模型的复杂度不匹配 (训练集的数量级<模型的复杂度)训练集和测试集特征分布不一致训练集里的噪音数据干扰过大 (模型过分记住了噪音特征,反而忽略了真实的输入输出关系)构建特征时,构建了没有或者过多没有代表性的特征解决方案调小模型复杂度,使其适合自己的训练集 (缩小宽度 | 减小深度)增加训练集的数量参数太多,也会增加模型的复杂度,这里可以正则化,惩罚模型不要过度训练重新清洗数据,(例如:对缺失值 | 无效值) 等的处理
复制链接