数据集划分脚本

此代码将数据集分为:训练+验证训练集验证集测试集,根据实际情况取相对应的文件即可。比如:
若你的训练代码中不包含验证集划分,取训练集验证集测试集使用;若包含验证集划分,取训练+验证测试集使用。

新建一个split_train_test.py文件,用来划分数据集,代码如下:

import os
import random

trainval_percent = 0.9    # 训练+验证
train_percent = 0.9   #训练

xmlfilepath = 'DataSet\\Annotations'    # 标注文件路径
txtsavepath = 'DataSet\\Main'  # 划分后txt文件存放路径

total_xml = os.listdir(xmlfilepath)
num = len(total_xml)    # 样本集总量:训练+验证+测试
total_index = range(num)
trainval_num = int(num * trainval_percent )    # 训练+验证的样本量
train_num = int(trainval_num  * train_percent)    # 训练样本量

trainval = random.sample(total_index, trainval_num)
train = random.sample(trainval, train_num)

ftrainval = open('DataSet\\Main\\trainval.txt', 'w')    # 训练+验证
ftrain = open('DataSet\\Main\\train.txt', 'w')   # 训练
fval = open('DataSet\\Main\\val.txt', 'w')    # 验证
ftest = open('DataSet\\Main\\test.txt', 'w')    # 测试

for i in total_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
        
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

great-wind

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值