train_test_split 数据集划分

最新推荐文章于 2023-08-23 12:11:49 发布

内心的笃定

最新推荐文章于 2023-08-23 12:11:49 发布

阅读量6.5k

点赞数 1

分类专栏： python数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013385362/article/details/79433246

版权

python数据分析专栏收录该内容

17 篇文章 1 订阅

订阅专栏

python中自带了数据集划分的函数 train_test_split()，通过from sklearn.model_selection import train_test_split导入库函数。train_test_split() 函数需要常用的4个参数：数据集的特征列、数据集的label列、期望划分测试集的大小、划分的随机种子值。返回4个结果分别是：训练集的特征列、测试集的特征列、训练集的label列、测试集的label列。

在机器学习的过程中，为了测试模型的性能，需通过将数据集划分为训练集和验证集，然后对验证集进行预测，评估。此时，如下代码与cv函数的功能是一样的。

from sklearn.model_selection import train_test_split

for i in range(10):

X_train, X_test, Y_train, Y_test = train_test_split(train[predictors], train['label'], test_size=0.4,random_state=i+1)

clf.fit(X_train,Y_train) #训练模型
pre=clf.predict(X_test)#预测

内心的笃定

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
train_test_split 数据集划分

python中自带了数据集划分的函数 train_test_split()，通过from sklearn.model_selection import train_test_split导入库函数。train_test_split() 函数需要常用的4个参数：数据集的特征列、数据集的label列、期望划分测试集的大小、划分的随机种子值。返回4个结果分别是：训练集的特征列、测试集的特征列、训练...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。