详细讲解交叉验证网格搜索过程

交叉验证网格搜索过程

假如交叉验证为4折交叉验证。

  • 在网格搜索的某个参数组合下,开始交叉验证。首先将训练集分为4份,每次选取3份作为训练集,一份作为验证集。使用训练集进行模型的训练,然后使用验证集进行模型的评估,RMSE作为评价模型性能的方式。
  • 在得到4个模型并分别使用验证集进行模型评估后,得到4个RMSE值。选取评估结果的平均数/中位数/方差作为该参数组合下,模型最终的评估结果。
  • 重新选取参数组合进行交叉验证,重复上述过程,得到对应参数组合模型最终的性能评估结果。
  • 求解完所有参数组合模型最终的性能评估结果,比较后找到性能评估结果最优的模型。使用该模型的超参数对4份训练集重新进行训练得到最佳模型。

默认情况下,使用K个评估结果的平均值作为最终的评估结果。

举例:4折交叉验证。超参数为alpha={1 , 2}

过程如下:

超参数alpha=1,进行一次交叉验证。

将训练集继续分为4份,其中3份作为训练集,一份作为验证集。依次命名为1,2,3,4
使用234作为训练集进行该参数下模型的训练,训练完成后使用1作为验证集进行性能的评估。同理,依次使用1,3,4和1,2,4和123作为训练集进行模型的训练,留下的验证集进行模型的性能评估。
指定性能评估方式为RMSE(均方根误差)-可以自己更改。4个模型使用对应的验证集进行评估后得到4个评估结果。对这4个评估结果求平均(可以更改),作为该超参数组合下,模型最终的评估结果。

超参数alpha=2,进行一次交叉验证。

同alpha=1的过程,得到4个模型后,使用验证集进行评估得到4个评估结果。对这4个评估结果求平均(可以更改),作为该超参数组合下,模型最终的评估结果。
重复这个过程。直到所有的超参数组合都进行了交叉验证。

本例超参数有2个组合,因此进行两次交叉验证得到2个最终评估结果。本例使用的是RMSE,因此值越小代表模型性能越好。将RMSE最小的超参数组合作为最终模型的超参数组合。使用这个超参数组合,使用完整的训练集重新进行训练,得到最终的模型。 交叉验证网格搜索过程结束。

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值