关于K-fold cross validation 下不同的K的选择的疑惑？

最新推荐文章于 2024-05-07 21:39:47 发布

Kylin-Xu

最新推荐文章于 2024-05-07 21:39:47 发布

阅读量5.9k

点赞数 1

分类专栏： machine learning 文章标签： machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kylinxu70/article/details/24806873

版权

在K-fold cross validation 下比较不同的K的选择对于参数选择（模型参数，CV意义下的估计的泛化误差）以及实际泛化误差的影响。更一般的问题，在实际模型选择问题中，选择几重交叉验证比较合适？

交叉验证的背景知识：

CV是用来验证模型假设（hypothesis）性能的一种统计分析方法，基本思想是在某种意义下将原始数据进行分组，一部分作为训练集，一部分作为验证集，使用训练集对每个hypothesis进行训练，再用验证集对每个hypothesis的性能进行评估，然后选取性能最好的hypothesis作为问题对应的模型。

常用CV 方法：

1. Hold-out method

最简单的验证方法，将训练数据随机分为两份（典型做法是七三分）。不是真正意义上的CV，没有交叉的思想，所以验证集上的测试精度与原始数据的分组有很大关系，具有随机性，不具有说服性。（是否可通过多次平均的方法来消除这种随机性？待验证）

2. K-fold CV

一般，k>=2。经验上，k取5即可（计算量与精度的权衡），k=5时的结果大致和10以上类似。

3. Leave-one-out CV（LOO-CV）

K-fold CV 的极端情况，将k设为样本数。

优点：（1）结果可靠。

（2）实验过程可被复制。

缺点：计算量过大。实际操作困难，除非并行化。

实验: 使用高斯核最小二乘做回归。

Code:

Contents

training set

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
关于K-fold cross validation 下不同的K的选择的疑惑？

在K-fold cross validation 下比较不同的K的选择对于参数选择（模型参数，CV意义下的估计的泛化误差）以及实际泛化误差的影响。更一般的问题，在实际模型选择问题中，选择几重交叉验证比较合适？交叉验证的背景知识：CV是用来验证模型假设（hypothesis）性能的一种统计分析方法，基本思想是在某种意义下将原始数据进行分组，一部分作为训练集，一部分作为验证集，使用训练
复制链接

扫一扫

专栏目录

Kylin-Xu CSDN认证博客专家 CSDN认证企业博客

码龄12年

7: 原创

23万+: 周排名

115万+: 总排名

24万+: 访问

: 等级

2085: 积分

59: 粉丝

22: 获赞

31: 评论

84: 收藏

私信

关注

热门文章

分类专栏

story 1篇
parallel communication 1篇
ToolBox 5篇
deep learning 44篇
ANN 30篇
math foundation 2篇
machine learning 29篇
latex 1篇
Boosting 1篇

最新评论

THE MNIST DATABASE
张牧之7: 下载MNISt数据集出现403forbidden怎么回事
DeepLearnToolbox_DBN notes
D_aguozi 回复哆啦C梦GO: 同问，这是什么意思呀
指数增长模型
CATCHTHEFITE: 图片都显示不出来能不能解决下？
k-折交叉验证(k-fold crossValidation)
沙小菜: 对于k交叉验证的工作流程有个疑问，他们是按下面的步骤工作的么？一个数据集一共有1,2,3三个部分，以model0为初始化参数第一波迭代：model0为初始化参数，1,2做训练集，3做测试集，得到参数模型model1，测试精度为pres1; 第二波迭代：model1为初始化参数，2,3做训练集，1做测试集，得到参数模型model2，测试精度为pres2; 第三波迭代：model2为初始化参数，3,1做训练集，2做测试集，得到参数模型model3，测试精度为pres3; 最终的测试结果为(pres1+pres2+pres3)/3。每次的迭代的初始化模型都是上一次迭代得来的？
k-折交叉验证(k-fold crossValidation)
闷声图样回复 wallace-lll: 分类准确率啊，无非是fit完了之后predict一下。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。