随机划分数据集五份_Scikit-Learn数据集划分函数的使用

最新推荐文章于 2024-02-23 16:07:50 发布

VIP文章 Ja'Soon

最新推荐文章于 2024-02-23 16:07:50 发布

阅读量1.6k

点赞数 2

文章标签：随机划分数据集五份

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31559919/article/details/112736259

版权

一、随机划分法

分层抽样(StratifiedShuffleSplit)

from sklearn.model_selection import StratifiedShuffleSplit

StratifiedShuffleSplit(n_splits=10,test_size=None,train_size=None, random_state=None)

n_splits：将数据集分成train/test对的组数，可根据需要进行设置，默认为10

train_size和test_size:是用来设置train/test对中train和test所占的比例。

参数random_state控制是将样本随机打乱

函数作用：(1)首先将数据集打乱n_splits次，产生n_splits组打乱的数据（2）其次根据设置的比例参数将每一组数据分层采样，所谓的分层采样就是保持在每一组划分后train和test中类别之间的比例与划分前的类别之间的比例相同。

如上图，在y_test和y_train中类别之间比例为1：1，划分前数据类别比例也是1：1。这就是分层采样，保证数据的类别采样均匀性

随机有放回的抽样(ShuffleSplit)

from sklearn.model_selection import ShuffleSplit

测试集的

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
随机划分数据集五份_Scikit-Learn数据集划分函数的使用

一、随机划分法分层抽样(StratifiedShuffleSplit)from sklearn.model_selection import StratifiedShuffleSplitStratifiedShuffleSplit(n_splits=10,test_size=None,train_size=None, random_state=None)n_splits：将数据集分成train/...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。