统计学习方法学习笔记(二)模型评估与模型选择,正则化与交叉验证,泛化能力

本文探讨了机器学习中模型评估的关键概念,包括训练误差与测试误差的差异,过拟合现象及其影响,以及如何通过正则化(如L1和L2范数)来缓解过拟合。此外,介绍了交叉验证方法,如简单交叉验证、s折交叉验证和留一交叉验证,以选择最佳模型。最后,解释了泛化能力的概念,它是衡量模型对未知数据预测准确性的关键指标。
摘要由CSDN通过智能技术生成

训练误差与测试误差

当损失函数给定时,基于损失函数的模型的训练误差 (training error) 和模型的测试误差 (test error) 就自然成为学习方法评估的标准。但是,统计学习方法具体采用的损失函数未必是评估时使用的损失函数
这句理解下,参考下在数据科学比赛中给出的评分标准,与实际学习采用的损失函数之间的关系。
在这里插入图片描述

过拟合

在这里插入图片描述

在多项式函数拟合中可以看到,随着多项式次数(模型复杂度)的增加,训练误差会减小,直至趋向于0 ,但是测试误差却不如此,它会随着多项式次数(模型复杂度)的增加先减小而后增大。而最终的目的是使测试误差达到最小。这样,在多项式函数拟合中,就要选择合适的多项式次数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值