train_test_split()中shuffle、randomstate参数作用

X = array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])
y = [0,1,2,3,4]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42,shuffle=True)#多次运行,四个子集不变
>>> X_train
>>> array([[4, 5],
       [0, 1],
       [6, 7]])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=None,shuffle=True)
>>> X_train
>>> array([[0, 1],
       [6, 7],
       [8, 9]])
       
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42,shuffle=False)#多次运行,四个子集不变
>>> X_train
>>> array([[0, 1],
       [2, 3],
       [4, 5]])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=None,shuffle=False)#结果同random_state=42,shuffle=False

综上,
当shuffle=True且randomstate 取整数,划分得到的是乱序的子集,且多次运行语句(保持randomstate值不变),得到的四个子集不变。当shuffle=True且randomstate =None,划分得到的是乱序的子集,且多次运行语句,得到的四个子集变化。
当shuffle=False,randomstate 不影响划分结果,划分得到的是顺序的子集,
结论:为保证打乱且每次实验的划分一致,只需设定random_state为整数(0~42),shuffle函数中默认=True

  • 7
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值