cifar10提供有几种生物和工业物品的图片供机器学习分类练习。为简单起见,可以利用目录把这些图片进行归类,以目录名作为标记。原始cifar10的图片以文件名分类,文件名中包含图片类别名称,比较复杂。为此,提供一个简单的python程序对文件重新组织。
import re
import glob
import os
file_ls=glob.glob(r'./*/*.png',recursive=True)
for file in file_ls:
result=re.sub(r'\D+\d+_','',file)
category=re.sub(r'\.png','',result)
path=re.sub(r'\d+_\D+','',file)
file_name=re.sub(r'^\D+/','',file)
dest_file=path+category+'/'+file_name
os.rename(file,dest_file)
运行环境:
1操作系统:linux
2程序运行目录:test和train的上一组目录
3运行前准备:在test和train目录下建立以下子目录:'airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'