sklearn中train_test_split参数的详细介绍

最新推荐文章于 2024-10-04 15:06:17 发布

永不落后于人

最新推荐文章于 2024-10-04 15:06:17 发布

阅读量4.6k

点赞数 5

分类专栏：机器学习文章标签：机器学习 python

本文链接：https://blog.csdn.net/FlatTiger/article/details/110131636

版权

19 篇文章 2 订阅

订阅专栏

sklearn中train_test_split()函数可以把数据集切分为随机的训练数据集和测试数据集。

下面是源代码中的举例：

X_train, X_test, y_train, y_test = train_test_split(
  X, y, test_size=0.33, random_state=42)

参数信息如下：

参数	含义
x	数据集中特征的集合
y	数据集中标签的集合
test_size	如果数值在0-1之间，代表测试数据集合所占比例。如果数值大于1，代表测试数据集的条数。默认为0.25
random_state	随机数种子。不指定每次运行代码切分的数据集都不一样，反之，切分的数据集是一致的

返回值