过拟合出现的原因及解决方案

过拟合出现的原因及解决方案

  • 原因

    1. 训练集的数量级和模型的复杂度不匹配 (训练集的数量级<模型的复杂度)
    2. 训练集和测试集特征分布不一致
    3. 训练集里的噪音数据干扰过大 (模型过分记住了噪音特征,反而忽略了真实的输入输出关系)
    4. 构建特征时,构建了没有或者过多没有代表性的特征
  • 解决方案

    1. 调小模型复杂度,使其适合自己的训练集 (缩小宽度 | 减小深度)
    2. 增加训练集的数量
    3. 参数太多,也会增加模型的复杂度,这里可以正则化,惩罚模型
    4. 不要过度训练
    5. 重新清洗数据,(例如:对缺失值 | 无效值) 等的处理
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值