笔记-cross validation(交叉验证)

机器学习任务中,最终目标是最小化模型在测试集(test dataset)上的错误(error)。在只有训练数据情况下,我们想模拟“训练”—>“测试”这一过程,即利用一部分数据集进行训练,再在另一部分数据集上进行假想测试。由于测试的数据集是属于训练数据的一部分,有label来验证测试结果,故能给建模调参提供依据,这部分带有label的测试数据叫做验证集(validation dataset)。每次按不同方式切分训练集和验证集,然后重复上述过程,称为交叉验证。cv原理与实现的参考链接如下:

Python scikit-learn机器学习工具包学习笔记:cross_validation模块 - yeting067的专栏 - CSDN博客

Sklearn.cross_validation模块和数据划分方法 - CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值