二、机器学习基础8(模型评估、欠拟合,过拟合)

模型评估

分类模型常用评估方法

回归模型常用评估方法

 

经验误差与泛化误差

误差(error):一般地,我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”
经验误差(empirical error):也叫训练误差(training error)。模型在训练集上的误差。
泛化误差(generalization error):模型在新样本集(测试集)上的误差称为“泛化误差”。

欠拟合、过拟合

根据不同的坐标方式,欠拟合与过拟合图解不同。

图中红线表示测试集误差,蓝线表示训练集误差

横轴为训练样本数量,纵轴为误差

模型欠拟合:在训练集以及测试集上同时具有较高的误差,此时模型的偏差较大;
模型过拟合:在训练集上具有较低的误差,在测试集上具有较高的误差,此时模型的方差较大。
模型正常:在训练集以及测试集上,同时具有相对较低的偏差以及方差。

横轴为模型复杂程度,纵轴为误差

模型欠拟合:模型在点 A 处,在训练集以及测试集上同时具有较高的误差,此时模型的偏差较大。
模型过拟合:模型在点 C 处,在训练集上具有较低的误差,在测试集上具有较高的误差,此时模型的方差较大。
模型正常:模型复杂程度控制在点 B 处为最优。

横轴为正则项系数,纵轴为误差

模型欠拟合:模型在点 C 处,在训练集以及测试集上同时具有较高的误差,此时模型的偏差较大。
模型过拟合:模型在点 A 处,在训练集上具有较低的误差,在测试集上具有较高的误差,此时模型的方差较大。
模型正常:模型复杂程度控制在点 B 处为最优。

解决过拟合与欠拟合方法

解决欠拟合:添加其他特征项;添加多项式特征;增加模型的复杂程度;减小正则化系数

解决过拟合:重新清洗数据;增加训练样本数量;降低模型复杂程度;增大正则项系数;采用 dropout 方法;early stoping;减少迭代次数;增大学习率;添加噪声数据;树结构中,可以对树进行剪枝。

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

满满myno

非常感谢对我创作的支持,爱你呦

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值