sklearn函数：train_test_split（分割训练集和测试集）

最新推荐文章于 2024-07-19 03:14:54 发布

daijingxin

最新推荐文章于 2024-07-19 03:14:54 发布

阅读量1.6k

点赞数 12

文章标签： sklearn 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daijingxin/article/details/136483653

版权

函数的功能是分割训练集和测试集

函数中参数的用法：

1. test_size：float or int, default=None

测试集的大小，如果是小数的话，值在（0,1）之间，表示测试集所占有的比例；

如果是整数，表示的是测试集的具体样本数；

如果train_size也是None的话，会有一个默认值0.25

2. train_size：float or int, default=None

和test_size一样，同上

3.random_state：int or RandomState instance, default=None

这个参数表示随机状态，因为每次分割都是随机的，
设置为整数则每次分割不随机
注意：只有当shuffle=True时，random_state才起作用

4.shuffle: bool, default=True

是否重洗数据（洗牌），就是说在分割数据前，是否把数据打散重新排序这样子，看上面我们分割完的数据，都不是原始数据集的顺序，默认是要重洗的

5.stratify：array-like, default=None

这个要配合结果集使用，假设原始的结果集中有2种分类，A：B=1:2

我们在随机分配的时候，是无法保证训练集和测试集中的A与B的比例

这时候，就可以用这个参数了，设置stratify=y，就可以让测试集和训练集中的结果集也保证这种分布

关注

12
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

daijingxin 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。