train_test_split 数据集划分

    python中自带了数据集划分的函数 train_test_split(),通过from sklearn.model_selection import train_test_split导入库函数。train_test_split() 函数需要常用的4个参数:数据集的特征列、数据集的label列、期望划分测试集的大小、划分的随机种子值。返回4个结果分别是:训练集的特征列、测试集的特征列、训练集的label列、测试集的label列。

    在机器学习的过程中,为了测试模型的性能,需通过将数据集划分为训练集和验证集,然后对验证集进行预测,评估。此时,如下代码与cv函数的功能是一样的。

from sklearn.model_selection import train_test_split

for i in range(10):

    X_train, X_test, Y_train, Y_test = train_test_split(train[predictors], train['label'], test_size=0.4,random_state=i+1)

    clf.fit(X_train,Y_train) #训练模型
    pre=clf.predict(X_test)#预测

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值