过拟合和欠拟合

拟合

实际就是数学模型

一:过拟合

训练集表现好,但是测试集表现不佳,即泛化性能差(泛化误差)

原因:

1.样本单一

2.正负样本比例不协调

3.异常点太多

4.模型越来越复杂

解决方式:

1.如果是样本单一,可以增加训练的数据集

2.如果是正负样本不协调,可以通过配比权重解决

如何防止过拟合:

1.最根本的可以通过扩大数据量

2.nlp拆解语句组成新的数据集

3.控制模型复杂度

​ 3.1 随机森林可以控制树的复杂度

​ 3.2 正则化/集成学习

​ 3.3 减少训练次数,早点结束训练

二:欠拟合

训练集和测试集都表现不佳,即模型学习能力不佳(训练误差)

原因:

模型太烂

解决方法:

好好训练,增加特征或者数据量进行重新训练

三:方差和偏差的较量

从数学的角度,过拟合和欠拟合是方差和偏差的较量

偏差大偏差小
方差大模型不适合这个数据集
换模型
过拟合
模型很复杂
对训练数据集预测很准
对测试数据集预测很糟糕
方差小欠拟合
模型相对较简单
预测不稳定,且对所有的数据集预测都不太准确
泛化和误差小,属于理想的模型
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值