引言
作为一个初学者,在大家平常的学习中都会使用类似于mnist这种可以直接下载导入的数据集,但是当在本地有一组文件层级如下的数据集需要导入处理使,没有什么好的直接的库可以使用,我在一次机器学习的比赛中便遇到了这样的问题
|-imagess
|-apple
|-1.jpg
|-2.jpg
|-3.jpg
|-4.jpg
|-5.jpg
...
|-banana
|-1.jpg
|-2.jpg
|-3.jpg
...
|-orange
....
直接上代码了
先是导包
import os, cv2
import numpy as np
import tensorflow as tf
第一步遍历最外层根目录,获得子目录
data_dir = 'imagess/'
contents = os.listdir(data_dir)
classes = [each for each in contents if os.path.isdir(data_dir + each)]
第二步,我是要把所有数据整理为[224,224,3],循环每一个文件夹,将图片数据放在inputfirst中 将标签放入labels 代码可能不太好看,但是至少完成了需求。
labels = []
inputfirst=tf.placeholder(tf.float32, [None, 224, 224, 3])
input_ = tf.placehold