分割数据集

sklearn函数:train_test_split(分割训练集和测试集)
x是array类型

from sklearn.model_selection import train_test_split

x_train,x_test = train_test_split(x)
xtrain
x_test
  • test_size:float or int, default=None

测试集的大小,如果是小数的话,值在(0,1)之间,表示测试集所占有的比例;

如果是整数,表示的是测试集的具体样本数;

如果train_size也是None的话,会有一个默认值0.25

上面的练习,就保持了默认,所以测试集就有3个样本了

  • train_size:float or int, default=None

和test_size一样,同上

  • random_state:int or RandomState instance, default=None

这个参数表示随机状态,因为每次分割都是随机的,我们重新执行几次上面的函数看看先

只有当shuffle=True时,random_state才起作用或者说才有意义,random_state随机取一个整数就好,保证每次分割出来的数据集是一样的。

shuffle: bool, default=True,默认是

是否重洗数据(洗牌),就是说在分割数据前,是否把数据打散重新排序这样子,看上面我们分割完的数据,都不是原始数据集的顺序,默认是要重洗的

x_train,x_test = train_test_split(x , train_size=4)
x_train

x_train,x_test = train_test_split(x , train_size=0.8)
x_train

 sklearn函数:KFold(分割训练集和测试集)

 

classsklearn.model_selection.KFold(n_splits=5,*,shuffle=False,random_state=None) 

  • n_splits:int, default=5

表示,要分割为多少个K子集

  • shuffle:bool, default=False

是否要洗牌(打乱数据)

  • random_state:int or RandomState instance, default=None

这和前一篇中提到的随机状态是一样的,需要配合shuffle参数使用

这个参数表示随机状态,因为每次分割都是随机的,我们重新执行几次上面的函数看看先

只有当shuffle=True时,random_state才起作用或者说才有意义,random_state随机取一个整数就好,保证每次分割出来的数据集是一样的。

import numpy as np
from sklearn.model_selection import KFold

X = np.random.randint(1,100,20).reshape((10,2))
X

kf = KFold(n_splits=5)
kf

for X_train,X_test in kf.split(X):
    print(X_train,X_test)

for X_train_i,X_test_i in kf.split(X):
    print(X[X_train_i],X[X_test_i])

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
COCO分割数据集的制作是基于目标检测数据集的,首先需要选择通用的COCO格式数据集进行制作。具体的制作过程可以参考引用中的文章,该文章提供了对COCO目标检测分割数据集格式的介绍,包括标注文件的格式和内容。在制作过程中,可以借助引用提供的完整教程和转换程序代码,跟着操作即可完成数据集的制作。 制作COCO分割数据集的主要步骤包括以下几个方面: 1. 数据采集:收集包含目标物体的图像和相应的标注数据。 2. 数据标注:使用合适的工具对图像进行标注,标注出目标物体的边界框和像素级别的分割掩码。 3. 数据转换:将标注数据转换为COCO数据集的格式,包括标注文件和图像文件。 4. 数据拆分:根据需求将数据集划分为训练集、验证集和测试集。 5. 数据预处理:对图像和标注数据进行预处理,如图像大小调整、数据增强等。 6. 数据集管理:组织和管理数据集,确保数据集的质量和完整性。 以上是COCO分割数据集制作的一般步骤,具体的实施方式可以参考引用和引用中的文章,它们提供了详细的操作指导和代码示例,有助于你完成COCO分割数据集的制作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [COCO_02 二值分割数据集制作为COCO数据集](https://blog.csdn.net/qq_44776065/article/details/128697177)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [coco、voc实例分割数据集制作-labelme](https://download.csdn.net/download/weixin_42715977/85981276)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值