交叉验证(cross validation)

交叉验证是评估模型泛化能力的重要方法,通过将数据集划分为训练集、验证集和测试集来避免过拟合。过拟合可能导致模型在新数据上的表现不佳。K折交叉验证,如5折或10折,是常见的实践,每次使用一部分数据作为验证集,其余作为训练,确保结果的代表性。sklearn库提供了KFold工具进行方便的交叉验证操作。
摘要由CSDN通过智能技术生成

        针对不同参数和结构的模型,他们的泛化能力我们为了评估无从可知,为了了解模型的泛化能力,我们引入了交叉验证。所以我们在划分数据集的时候,通常会将数据集划分为三个数据集,三个数据集分别是:训练集(train set),评估集(valid set)和测试集(test set)。交叉验证结果越小,说明模型的泛化能力越强

        1.过拟合

        一个小栗子说明模型的泛化能力:

        例如多项式函数f(x) = a0 + ax^1 + ax^2 +......

        我们知道,当多项目函数的幂次项越高,模型的拟合效果越好,但是也同时会产生一定的过拟合。

        2.交叉验证

       交叉验证的一个极端叫去一法。即每次从数据中取出一个样本,然后用剩余的样本进行训练。K折交叉验证即将数据分为K个部分,每次取其中一个部分,剩余部分用来做测试,共需要进行K次。一般用用5折和10折交叉验证。下图(5折交叉验证)能够很好的反应交叉验证的方法:

  • 0
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值