数据集划分-交叉验证（CV）

最新推荐文章于 2022-07-24 15:32:02 发布

Justin_stf

最新推荐文章于 2022-07-24 15:32:02 发布

阅读量3.3k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41798592/article/details/101083548

版权

数据集划分-交叉验证（CV）

通过将原始数据分为3个数据集合，我们就大大减少了可用于模型学习的样本数量，并
且得到的结果依赖于集合对（训练，验证）的随机选择。这个问题可以通过交叉验证（CV ）来解决。交叉验证仍需要测试集做最后的模型评估，但不再需要验证集。

最基本的方法：k-折交叉验证。
k-折交叉验证将训练集划分为 k 个较小的集合（其他方法会在下面描述，主要原则基本相同）。每一个 k 折都会遵循下面的过程：

将 k-1 份训练集子集作为 training data （训练集）训练模型，
将剩余的 1 份训练集子集作为验证集用于模型验证（也就是利用该数据集计算模型的性能指标，例如准确率）。

k-折交叉验证得出的性能指标是循环计算中每个值的平均值。该方法虽然计算代价很高，但是它不会浪费太多的数据（如固定任意测试集的情况一样），在处理样本数据集较少的问题（例如，逆向推理）时比较有优势。
在这里插入图片描述

sklearn.model_selection.cross_val_score

sklearn.model_selection.cross_val_score

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
数据集划分-交叉验证（CV）

数据集划分-交叉验证（CV）通过将原始数据分为3个数据集合，我们就大大减少了可用于模型学习的样本数量，并且得到的结果依赖于集合对（训练，验证）的随机选择。这个问题可以通过交叉验证（CV ）来解决。交叉验证仍需要测试集做最后的模型评估，但不再需要验证集。最基本的方法：k-折交叉验证。k-折交叉验证将训练集划分为 k 个较小的集合（其他方法会在下面描述，主要原则基本相同）。每一个 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。