过拟合和欠拟合

过拟合(overfitting)

过拟合指的是模型在训练集上表现的很好,但是在训练集外的数据集上(e.g.,交叉验证集和测试集)表现一般,也就是说模型对对新数据的预测表现一般,泛化(generalization)能力较差。

产生原因

a.训练数据过少或存在噪音,无法对整个数据的分布进行估计
b.特征维度过多,求解模型中没有那么多的特征值得重用
c.在对模型进行过度训练(overtraining)时,常常会导致模型的过拟合

解决办法

数据清洗、增加训练集、early stopping、数据集扩增(Data augmentation)、正则化(Regularization)、Dropout(神经网络)

欠拟合(underfitting)

过拟合指的是模型没有很好地捕捉到数据特征,导致拟合的函数在训练集上表现效果差,预测的准确率低。

产生原因

解决办法

1.添加其他特征项(e.g.,“组合”、“泛化”、“相关性”),模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决。
2.添加多项式特征,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强
3.减少正则化参数,正则化的目的是用来防止过拟合的,当模型出现了欠拟合,则需要减少正则化参数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值