根据自己的数据集,自动划分训练集、测试集
举个栗子:
已经分好的文件:
origin 文件夹有三类数据:good,bad,m,每类文件夹包含不同数量的图片,如下:
需要生成数据集的文件:
结果:根据设置好的比例,划分数据集和测试集
完整代码:
import random
import os
import shutil
import glob
class get_data_sets():
'''
input_address:输入地址
output_adddress:输出的地址
train_ratio:训练集站比,(0,1)
'''
def __init__(self,input_address,output_adddress, train_ratio):
self.__input_address = input_address
sel