Sklearn-train_test_split随机划分训练集和测试集

最新推荐文章于 2024-07-19 03:14:54 发布

不负韶华T

最新推荐文章于 2024-07-19 03:14:54 发布

阅读量8.5k

点赞数 2

分类专栏： Python tensorflow

Python 同时被 2 个专栏收录

40 篇文章 2 订阅

订阅专栏

22 篇文章 0 订阅

订阅专栏

sklearn.model_selection.train_test_split随机划分训练集和测试集

官网文档：http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split

一般形式：

train_test_split是交叉验证中常用的函数，功能是从样本中随机的按比例选取train data和testdata，形式为：

X_train,X_test, y_train, y_test =

cross_validation.train_test_split(train_data,train_target,test_size=0.4, random_state=0)

参数解释：

train_data：所要划分的样本特征集

train_target：所要划分的样本结果

test_size：样本占比，如果是整数的话就是样本的数量

random_state：是随机数的种子。

随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。

随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：

种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。

示例

[python] view plain copy

fromsklearn.cross_validation import train_test_split
train= loan_data.iloc[0: 55596, :]
test= loan_data.iloc[55596:, :]
# 避免过拟合，采用交叉验证，验证集占训练集20%，固定随机种子（random_state)
train_X,test_X, train_y, test_y = train_test_split(train,
target,
test_size = 0.2,
random_state = 0)
train_y= train_y['label']
test_y= test_y['label']

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

不负韶华T CSDN认证博客专家 CSDN认证企业博客

码龄9年

44: 原创

52万+: 周排名

90万+: 总排名

97万+: 访问

: 等级

7556: 积分

241: 粉丝

349: 获赞

70: 评论

1573: 收藏

私信

关注

热门文章

分类专栏

wavelet 8篇
java 6篇
algorithm 3篇
c++ 1篇
interview 2篇
android 2篇
linux 42篇
miscellaneous 9篇
machine learning 18篇
matlab 20篇
math 13篇
deeplearning 13篇
FFT 1篇
HHT 2篇
Hilbert 5篇
windows 2篇
Python 40篇
tensorflow 22篇
Cygwin 4篇

最新评论

瞬时频率估计方法
DotNet的小云: 你换个真实采集的振动信号，再估计，会出现负频率
circshift 函数详解
NEWEVA__zzera22: >> A=[1,2,3,4,5,6,7,8,9] A = 1 2 3 4 5 6 7 8 9 >> A=[1,2,3;4,5,6;7,8,9] A = 1 2 3 4 5 6 7 8 9 >> circshift(A,1) ans = 7 8 9 1 2 3 4 5 6 >>
circshift 函数详解
weixin_43826838: 写反了把
信号处理——Hilbert变换及谱分析
闪电式: 作者您好，你的文章显示好像出现了错误，开始的那几个公式显示不出来，刷新的一瞬间可以看见
matlab 中imagesc的用法
Cheng_again: 一眼阴真，鉴定为寄

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。