提取fashion-mnist数据库图片到分类别的文件夹

最新推荐文章于 2024-05-20 11:44:40 发布

lillllllll

最新推荐文章于 2024-05-20 11:44:40 发布

阅读量507

点赞数 1

分类专栏：深度技术学习数据库

本文链接：https://blog.csdn.net/lillllllll/article/details/110767641

版权

深度技术学习同时被 2 个专栏收录

12 篇文章 3 订阅

订阅专栏

数据库

8 篇文章 0 订阅

订阅专栏

fashion-mnist数据库是具有挑战性的机器图像分类数据库 (不过这个数据集比较容易，我的实验识别准确率已经达到了99.98，几乎100%了)，该数据库官方文档给出的数据库文件格式是idx3-ubyte（图像）和idx1-ubyte（标签），参考了网上的方法，我们可以将图片其提取出来放在文件夹中，每个文件夹是一个类别，下面装了该类别的所有图片，python代码如下：

#该代码是进行的测试集t10k-images-idx3-ubyte和t10k-labels-idx1-ubyte的图像提取
#对于训练集train-labels-idx1-ubyte和train-labels-idx1-ubyte，进行相应的替换就行
import numpy as np
import struct
 
from PIL import Image
import os
 

data_file = 'F:/imageclassify2020/fasionMNIST/t10k-images-idx3-ubyte'
fsize=os.path.getsize(data_file)
data_file_size=fsize
data_file_size = str(data_file_size - 16) + 'B'
 
data_buf = open(data_file, 'rb').read()
 
magic, numImages, numRows, numColumns = struct.unpack_from(
    '>IIII', data_buf, 0)
datas = struct.unpack_from(
    '>' + data_file_size, data_buf, struct.calcsize('>IIII'))
datas = np.array(datas).astype(np.uint8).reshape(
    numImages, 1, numRows, numColumns)
 
label_file = 'F:/imageclassify2020/fasionMNIST/t10k-labels-idx1-ubyte'
 
# It's 60008B, but we should set to 60000B
fsize=os.path.getsize(label_file)
label_file_size=fsize
label_file_size = str(label_file_size - 8) + 'B'
 
label_buf = open(label_file, 'rb').read()
 
magic, numLabels = struct.unpack_from('>II', label_buf, 0)
labels = struct.unpack_from(
    '>' + label_file_size, label_buf, struct.calcsize('>II'))
labels = np.array(labels).astype(np.int64)
 
datas_root = 'mnist_test'
if not os.path.exists(datas_root):
    os.mkdir(datas_root)
 
for i in range(10):
    file_name = datas_root + os.sep + str(i)
    if not os.path.exists(file_name):
        os.mkdir(file_name)
 
for ii in range(numLabels):
    img = Image.fromarray(datas[ii, 0, 0:28, 0:28])
    label = labels[ii]
    file_name = datas_root + os.sep + str(label) + os.sep + \
        'mnist_test_' + str(ii) + '.png'
    img.save(file_name)

下面是显示结果：

lillllllll

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
提取fashion-mnist数据库图片到分类别的文件夹

fashion-mnist数据库是具有挑战性的机器图像分类数据库，该数据库官方文档给出的数据库文件格式是idx3-ubyte（图像）和idx1-ubyte（标签），参考了网上的方法，我们可以将图片其提取出来放在文件夹中，每个文件夹是一个类别，下面装了该类别的所有图片，python代码如下：#该代码是进行的测试集t10k-images-idx3-ubyte和t10k-labels-idx1-ubyte的图像提取#对于训练集train-labels-idx1-ubyte和train-labels-idx
复制链接

扫一扫