yolo划分数据集

该文章介绍了如何使用Python的os和shutil库对文本和图像文件进行随机划分,将80%的数据用于训练集,剩下的20%用于验证集,以支持深度学习项目的训练和验证过程。
摘要由CSDN通过智能技术生成
import os
import random
import shutil
def split():
        path_dir = os.listdir(txt_dir)    #获取标签列表
   
        random.shuffle(path_dir)
        split_point = int(0.8 * len(path_dir))
 
        train_set = path_dir[:split_point]
        val_set = path_dir[split_point:]


        for text in train_set:
            name = os.path.splitext(text)[0]
            shutil.copy(os.path.join(txt_dir, text), os.path.join(train_txt, text) )
            shutil.copy(os.path.join(img_dir, name + ext), os.path.join(train_img, name + ext))

       
        for text in val_set:
            name = os.path.splitext(text)[0]
            shutil.copy(os.path.join(txt_dir, text), os.path.join(val_txt, text))
            shutil.copy(os.path.join(img_dir, name + ext),  os.path.join(val_img, name + ext))

        return


if __name__ == '__main__':

    ext = ".jpg" #默认图像的后缀

    img_dir = r"D:\split_json_coco\JPEGImages" #原始图像文件夹
    txt_dir = r"D:\split_json_coco\split" #原始txt文件夹
    
    train_img = r"D:\split_json_coco\train_img"#划分train图像文件夹
    train_txt = r"D:\split_json_coco\train_txt"#划分train_txt文件夹

    val_img =r"D:\split_json_coco\val_img"    #划分val图像文件夹
    val_txt = r"D:\split_json_coco\val_txt" #划分val_txt文件夹

    if os.path.exists(train_img) == False:
        os.makedirs(train_img)
    if os.path.exists(train_txt) == False:
        os.makedirs(train_txt)
    if os.path.exists(val_img) == False:
        os.makedirs(val_img)
    if os.path.exists(val_txt) == False:
        os.makedirs(val_txt)
    
    split()

        
  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值