为了学tensorflow,网上教程看了不少,大部分是利用mnist数据集,但是大部分都是利用已经处理好的非图片形式进行训练的;而且很多人都说不要自己造轮子,直接跑别人的代码,然后修改和学习,不过我觉得其实从数据集,到训练,到测试写下来,也有不少收获的。
本篇博客主要讲的是如何将自己的图片数据集进行处理,然后搭建神经网络结构,训练数据,保存和加载模型,测试等过程,其中利用mnist图片数据集(mnist),代码(Github)。下面我分步讲解一下,跟大家一起学习。参考博客附后。
如前文所述,现在的入门教程基本是跑mnist代码,但是数据集是处理后的,那么如何处理自己的图像数据集?首先要将图片数据集制作成tfrecords格式的数据。简单的说,tfrecords是一种tensorflow方便快速读取数据的一种二进制文件,适用于大量数据的处理。下面的代码将说明如何将图像制作成tfrecords文件,该mnist图片数据集大小为(28,28,3)。
# current work dir
cwd = os.getcwd()
# data to int64List
def _int64_feature(value):
return tf.train.Feature(int64_list = tf.train.Int64List(value=[value]))
# data to floatlist
def _float_feature(value):
return tf.train.Feature(float_list = tf.train.FloatList(value=[value]))
# data to byteslist
def _bytes_feature(value):
return tf.train.Feature(bytes_list = tf.train.BytesList(value=[value]))
# convert image data to tfrecords
def generate_tfrecords(data_dir,filepath):
# gen a tfrecords object write
write = tf.python_io.TFRecordWriter(filepath)
#print cwd
for index,name in enumerate(num_classes):
#print class_path
file_dir = data_dir + name + '/'
for img_name in os.listdir(file_dir):
img_path = file_dir + img_name
print img_path
img = cv2.imread(img_path)
img_raw = img.tobytes()
example = tf.train.Example(features=tf.train.Features(feature={
'label':_int64_feature(index),
'img_raw':_bytes_feature(img_raw)}))
# convert example to binary string
write.write(example.SerializeToString())
write.close()
tf.python_io.TFRecordWriter返回一个writer对象用于将data_dir制作后的数据存入filepath中保存,该文件就是tfrecords文件。另外,tf.train.Example将数据处理成key-value(在这里就是标签-图像)的格式返回一个example对象。最后writer将数据写到filepath中,关闭writer,就完成了图片数据到二进制文件的制作过程。
制作完成之后,在神经网络中如何读取和解析呢?如下代码
# read and decode tfrecord
def read_and_decode_tfrecord(filename):
# produce file deque
filen