python从date目录导入数据集_使用python划分数据集

最新推荐文章于 2023-02-25 11:06:17 发布

weixin_39745269

最新推荐文章于 2023-02-25 11:06:17 发布

阅读量136

点赞数

文章标签： python从date目录导入数据集

importglobimportos.pathimportrandomimportnumpy as np#图片数据文件夹

INPUT_DATA = './flower_data'

#这个函数从数据文件夹中读取所有的图片列表并按训练、验证、测试数据分开#testing_percentage和validation_percentage指定了测试数据集和验证数据集的大小

defcreate_image_lists(testing_percentage,validation_percentage):#得到的所有图片都存在result这个字典里，key为类别的名称，value值也是一个字典，存放的是该类别的

#文件名、训练集、测试集和验证集

result ={}#获取当前目录下所有的子目录,这里x 是一个三元组(root,dirs,files)，第一个元素表示INPUT_DATA当前目录，

#第二个元素表示当前目录下的所有子目录,第三个元素表示当前目录下的所有的文件

sub_dirs = [x[0] for x inos.walk(INPUT_DATA)]#sub_dirs = ['./flower_data','./flower_data\\daisy','./flower_data\\dandelion',

#'./flower_data\\roses','./flower_data\\sunflowers','./flower_data\\tulips']

#每个子目录表示一类花，现在对每类花划分训练集、测试集和验证集

#sub_dirs[0]表示当前文件夹本身的地址，不予考虑，只考虑他的子目录（各个类别的花）

for sub_dir in sub_dirs[1:]:#获取当前目录下所有的有效图片文件

extensions = ['jpg','jpeg']#把图片存放在file_list列表里

file_list =[]#os.path.basename(sub_dir)返回sub_sir最后的文件名

#如os.path.basename('./flower_data/daisy')返回daisy

dir_name =os.path.basename(sub_dir)for extension inextensions:

file_glob= os.path.join(INPUT_DATA,dir_name,'*.'+extension)#glob.glob(file_glob)获取指定目录下的所有图片，存放在file_list中

file_list.extend(glob.glob(file_glob))if not file_list: continue

#通过目录名获取类别的名称,返回将字符串中所有大写字符转换为小写后生成的字符串

label_name =dir_name.lower()#初始化当前类别的训练数据集、测试数据集和验证数据集

training_images =[]

testing_images=[]

validation_images=[]for file_name infile_list:

base_name=os.path.basename(file_name)#随机将数据分到训练数据集、测试数据集和验证数据集

#产生一个随机数，最大值为100

chance = np.random.randint(100)if chance

validation_images.append(base_name)elif chance < (testing_percentage+validation_percentage):

testing_images.append(base_name)else:

training_images.append(base_name)#将当前类别是数据放入结果字典

result[label_name]={'dir':dir_name,'training':training_images,'testing':testing_images,'validation':validation_images}#返回整理好的所有数据

returnresult

result= create_image_lists(10,30)print(result)

weixin_39745269

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python从date目录导入数据集_使用python划分数据集

importglobimportos.pathimportrandomimportnumpy as np#图片数据文件夹INPUT_DATA = './flower_data'#这个函数从数据文件夹中读取所有的图片列表并按训练、验证、测试数据分开#testing_percentage和validation_percentage指定了测试数据集和验证数据集的大小defcreate_image_lis...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。