使用train_test_split划分数据集

目录

1.简介

2.参数说明

3.返回值

4.示例


1.简介

  train_test_splitsklearn 库中的一个函数,用于将数据集分割为训练集和测试集。

2.参数说明

train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True, stratify=None)
  • *arrays:一个或多个数组样例,可以是NumPy数组、Pandas DataFrame或任何其他序列类型。这些数组将根据指定的比例被分割。

  • test_size:单个浮点数,表示测试集占总数据的比例。如果设置,train_size 将被忽略。默认值为0.25,即测试集占25%。

  • train_size:单个浮点数或整数,表示训练集占总数据的比例或具体的样本数量。如果设置了 test_size,则此参数将被忽略。

  • random_state:随机数生成器的种子。如果为整数,random_state 将固定随机数生成器的状态,这有助于确保结果的可重复性。如果为 None(默认值),则每次运行结果可能不同。

  • shuffle

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值