将文件夹内文件按照一定比例分为训练集和测试集

在训练自己模型的时候往往需要自己准备数据集,并将数据集按照一定比例随机分为训练集和测试集,以下是一个简单的脚本,可满足此需要

# coding: utf-8
import os
import random
import shutil	
def moveFile(data_base):
	
	fileDir = data_base+"mark/"  # 原文件夹路径
    xml_dir= data_base+'/xml/'

    train_dir = data_base+'result/mark/'  # 移动到新的文件夹路径
    test_dir = data_base+'result/test/mark/'

    train_xml_dir = data_base+'result/xml/'
    test_xml_dir= data_base+'/result/test/xml/'

    if not os.path.exists(train_dir):
        os.makedirs(train_dir)
    if not os.path.exists(test_dir):
        os.makedirs(test_dir)
    if not os.path.exists(test_xml_dir):
        os.makedirs(test_xml_dir)
    if not os.path.exists(train_xml_dir):
        os.makedirs(train_xml_dir)
        
    pathDir = os.listdir(fileDir)  # 取图片的原始路径
    filenumber = len(pathDir)
    rate = 0.3  
    number = int(filenumber * rate)           # 按照rate比例从文件夹中取数据
    sample = random.sample(pathDir, number)  # 随机选取picknumber数量的数据
    #print (sample)
    for name in sample:
        print(name)
        shutil.copy(fileDir + name, test_dir + name)
        item = name[:-4]
        print(xml_dir + item + '.xml')
        print(test_xml_dir+item+'.xml')
        shutil.copy(xml_dir+item+'.xml',test_xml_dir+item+'.xml')

    for filename in os.listdir(fileDir):
        if filename not in os.listdir(test_dir):
            shutil.copy(os.path.join(fileDir,filename),os.path.join(train_dir,filename))
            shutil.copy(xml_dir + filename[:-4]+ '.xml',train_xml_dir + filename[:-4] + '.xml')
    return
if __name__ == '__main__':

    data_base = 文件夹路径
    moveFile(data_base)
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Hello 阿月

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值