sklearn.model_selection.train_test_split用法解析

本文详细解析了sklearn.model_selection.train_test_split的API,介绍了如何使用该函数将数据集随机分为训练集和测试集,并讨论了test_size、train_size、random_state和stratify等参数的作用。通过具体的例子展示了如何保持类别比例,确保在训练和测试中数据分布的一致性。
摘要由CSDN通过智能技术生成

 

一、API解析

sklearn.model_selection.train_test_split(*arraystest_size=Nonetrain_size=Nonerandom_state=Noneshuffle=Truestratify=None)

该函数核心功能是:将样本数组或者矩阵按随机的方式分成训练集和测试集。

*arrays:数据的整体样本,类型可以是lists,numpy arrays,scipy-sparse matrices,pandas dataframes

test_size:(0,1)间的float值,表示测试集的数量占比。如果为整数,则为测试集的数据量。如果为None,则为整体减去训练集的差集合。如果train_size也是None,则为0.25

train_size:(0,1)间的float值,表示训练集的数量占比。如果为整数,则为训练集的数据量。如果为None,则为整体减去测试集的差集合

random_state:随机数的种子。 表示随机数的编号,在需要重复试验的时候,得到一组一样的随机

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值