函数:sklearn.model_selection 的 train_test_split

train_test_split()函数
作用:是用来随机划分样本数据为训练集和测试集的
完整格式为:
X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.4, random_state=0,stratify=y_train)

  • train_target为所要划分的样本结果。
  • test_size与train_size为所要划分的数据比例,默认为0.25与0.75
  • random_state称之为随机数种子,当random为none时,每一次划分的数据都是随机的。当其为整数时,划分的数字为固定的。
  • stratify用于当数据不平衡时,可以按比例平衡分配,stratify=x时,按x比例分配,stratify=y时按,y的比例分配,以下为实践代码。
#显示分类器的作用
import numpy as np
from sklearn.model_selection import train_test_split
x = np.arange(20)
import numpy as np
from sklearn.model_selection import train_test_split
x = np.arange( 20)
y = [ 'A','B' ,'A','A' , 'A','B' ,'A','B','B','A','A','B','B','A','A','B','A','B','A','A']
#test_size 与train_size 参数是用来分离数据的比例 默认情况下test_size为0.25而train_size为0.75
X_train , x_test , y_train,y_test = train_test_split(x,y,test_size=0.3,random_state=None)
#当random_state=None时数据不同 为整数时每次的数据都相同
print(x_test)
print(y_test)
print(X_train)
print(y_train)
#stratify参数可以处理数据不不平衡的问题。如下 stratify=x就是按x的比例去分配数据 =y同理
x = np.arange(20)
X_train , x_test , y_train,y_test = train_test_split(x,y,test_size=0.3,random_state=None,stratify=y)
print("对stratify参数的测试")
print(x_test)
print(y_test)
print(X_train)
print(y_train)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值