tensorflow读取分类数据集，并随机将其分割为训练集和测试集，以tfrecords形式保存

最新推荐文章于 2023-05-31 17:09:32 发布

上进的小菜鸟

最新推荐文章于 2023-05-31 17:09:32 发布

阅读量5.9k

点赞数 3

分类专栏：数据集 tensorflow 文章标签：读取分类数据集随机分割数据集为测试集和训练集 tfrecord格式保存和读取数据 json格式保存和读取数据

本文链接：https://blog.csdn.net/qq_35153620/article/details/102657940

版权

该博客介绍如何使用TensorFlow处理分类数据集，首先下载flower照片数据集，然后随机将其划分为训练集和测试集。接着，将处理后的数据以TFRecord格式进行保存。同时，提供了读取TFRecord格式数据的示例。

摘要由CSDN通过智能技术生成

本文以flower分类数据集为例，数据集存储格式为：以类别名命名文件夹，将不同类别图像存储在里面

1.根据下载好的分类数据集进行随机分割，读取，保存

linux系统下输入一下命令：

wget http://download.tensorflow.org/example_images/flower_photos.tgz

tar xzf flower_photos.tgz

windows直接输入下面链接下载：

http://download.tensorflow.org/example_images/flower_photos.tgz

def get_dataset_dict(imagedir, train_percentage=8):
    rootdir = imagedir
    category = [x[1] for x in os.walk(imagedir)][0]
    dataset = {}
    label = {}
    for j, class_name in enumerate(category):
        subdir = os.path.join(rootdir, class_name)
        imagelist = os.listdir(subdir)
        number = len(imagelist)
        label[class_name] = j
        train_dataset = []
        test_dataset = []
        for i, image in enumerate(imagelist):
            r = random.randint(0, number)
            if r < number / 10