文章目录
MNIST数据集官网(需要翻墙): http://yann.lecun.com/exdb/mnist/
操作步骤
step1.创建项目,在新的python文件中直接将下面代码复制,不需要提前下MNIST数据集
step2.在项目中创建一个文件,文件名为 MNIST_data_folder
step3.直接运行程序就行
代码
import tensorflow.examples.tutorials.mnist.input_data as input_data
import os
from PIL import Image
import numpy as np
MNIST_data_folder = 'MNIST_data_folder'
mnist = input_data.read_data_sets(MNIST_data_folder, one_hot=False) #MNIST_data_folder是数据集的目录
# imgs, labels = mnist.test.images, mnist.test.labels #生成测试集图片
imgs, labels = mnist.validation.images, mnist.validation.labels #生成验证集图片
# imgs, labels = mnist.train.images, mnist.train.labels #生成训练集图片
for i in range(10):
if not os.path.exists(str(i)):
os.makedirs(str(i))
cnt = [0 for i in range(10)]
for i in range(imgs.shape[0]):
array = (imgs[i].reshape((28, 28)) * 255).astype(np.uint8)
cnt[labels[i]] += 1
img = Image.fromarray(array, 'L')
img.save(str(labels[i]) + '\\' + str(cnt[labels[i]]) + '.jpg')
代码参考链接:https://www.cnblogs.com/wj-1314/p/9597119.html
效果
1.MNIST_data_folder 文件夹中自动下载保存MNIST数据集
注:不需要解压,代码自己提取其中的数据
2.提取出的数据自动生成0-9 10个文件夹,每个文件夹中存对应的数字图片
以数字0为例:
3.代码生成效果
4.MNIST数据分类
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 总计 | |
---|---|---|---|---|---|---|---|---|---|---|---|
训练集 | 5444 | 6179 | 5470 | 5638 | 5307 | 4987 | 5417 | 5715 | 5389 | 5454 | 55000 |
验证集 | 479 | 563 | 488 | 493 | 535 | 434 | 501 | 550 | 462 | 495 | 5000 |
测试集 | 980 | 1135 | 1032 | 1010 | 982 | 892 | 958 | 1028 | 974 | 1009 | 10000 |
总计 | 6903 | 7877 | 6990 | 7141 | 6,824 | 6,313 | 6,876 | 7,293 | 6825 | 6,958 | 70000 |
注:每个文件中图片都是从0开始命名