随机抽取数据作验证集validation

最新推荐文章于 2022-05-25 11:05:02 发布

jiachen0212

最新推荐文章于 2022-05-25 11:05:02 发布

阅读量2.6k

点赞数 1

文章标签： python 验证集

本文链接：https://blog.csdn.net/jiachen0212/article/details/78571979

版权

#coding=utf-8
#随机选取图像作为验证集val
import os
import random 
import cv2

file1 = '/home//img/'
valfile = '/home//val/'
valnum = 4   ＃val集的大小

＃这个check函数用以检查产生的随机的图像名称里有没有重名的，重复的话，写入新的文件夹下图像就会被覆盖，使得val的图像数量不等于valnum。
def check(random_list):
    a = 0
    for i in range(len(random_list)):
        for j in range(len(random_list)):
            if random_name_list[i] == random_name_list[j]:
                a += 1
    return a
    
name_list = list( name for name in os.listdir(file1))
random_name_list = list(random.choice(name_list) for _ in range(valnum)) 
a = check(random_name_list)
while a > len(random_name_list):   ＃按道理，没有重名图像的话，那么a就等于len（random_name_list）的
    random_name_list = list(random.choice(name_list) for _ in range(valnum))   ＃有重复，重新生成random list。
    a = check(random_name_list) 
print (random_name_list)
for i in range(len(random_name_list)):   
    img = cv2.imread(file1 + random_name_list[i], -1)
    cv2.imwrite(valfile + random_name_list[i], img)