sklearn划分数据集

最新推荐文章于 2024-05-12 13:31:13 发布

秋叶原の黑猫

最新推荐文章于 2024-05-12 13:31:13 发布

阅读量1.1k

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/corruptwww/article/details/108899678

版权

train_test_split是用得最多的数据集划分包，它的参数有五个：

*arrays：要切分的数据集，通过传入两个，X数据集和目标y

test_size：测试集样本大小

random_state：随机种子数

shuffle：是否要对数据集随机打乱

stratify：可以理解为分层抽样的设置值，通过针对分类问题的目标y

from sklearn.model_selection import train_test_split
from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
y = boston.target
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3)
#x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3,stratify=y) #按y比例分层抽样，通过用于分类问题

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

秋叶原の黑猫

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
sklearn划分数据集

train_test_split是用得最多的数据集划分包，它的参数有五个：*arrays：要切分的数据集，通过传入两个，X数据集和目标ytest_size：测试集样本大小random_state：随机种子数shuffle：是否要对数据集随机打乱stratify：可以理解为分层抽样的设置值，通过针对分类问题的目标yfrom sklearn.model_selection import train_test_splitfrom sklearn import datasetsboston = da
复制链接

扫一扫