K折交叉验证学习

一、思想

交叉验证主要用于防止模型过于复杂而引起的过拟合,是一种评价训练数据的数据集泛化 能力的统计方法。其基本思想是将原始数据进行划分,分成训练集和测试集,训练集用来对模型进行训练,测试集用来测试训练得到的模型,以此来作为模型的评价指标。

二、怎么交叉检验?

讲原始数据D按比例划分,比如7:3,从数据集中随机选取70%作为训练集,剩余的百分之30作为测试集。但是只做一次的话数据就没有充分利用,所以一般有以下规则:
如果训练数据集相对较小,则会增大K值,如果训练集相对较大,则减小K值。

三、怎么K折交叉检验?

将原始数据D随机分成K份,每次选择(K-1)份作为训练集,剩余的1份(红色部分)作为测试集。交叉验证重复K次,取K次准确率的平均值作为最终模型的评价指标。过程如下图所示,它可以有效避免过拟合和欠拟合状态的发生,K值的选择根据实际情况调节。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值