机器学习期末复习 1,2章

1.通过Bootstrap采样获得的训练集可能存在重复的样本。T

深度学习评估方法--留出法、交叉验证法、自助法

2.请你谈谈对过拟合和欠拟合的理解,以及如何缓解过拟合和欠拟合问题

我自己的理解:

过拟合是训练的模型在训练集上测试准确率很高,但是在测试集上准确率很低的情况;

欠拟合是因为训练模型太简单或训练轮次过少导致的训练集和测试集准确率都低。

形象理解:书上p24

对于欠拟合缓解:

减少正则项;

增加训练轮数;

决策树增加分支;

神经网络增加隐层个数或深度。

对于过拟合缓解:

添加正则项;

降低模型的复杂度;

增加训练集的数据,使特征更加全面;

如果很难再获取到更多训练数据,那么可以对已有训练数据进行合理扩充,增加数据的多样性;

对于决策树来说有预剪枝和后剪枝来预防过拟合;

早停策略:如果训练集准确率持续升高而测试集准确率持续降低,则停止。

什么是过拟合、欠拟合现象以及如何缓解?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值