MNIST手写数字识别_数据读取
基于已经下载好本地数据集或是通过keras成功导入数据集:
1.本地数据集
# 导入数据
mnist = input_data.read_data_sets('D:\pythonProject1\MNIST\MNIST_data',one_hot=True)
#路径为存储MNIST数据集的地址
#one_hot=True 设置热编码
One-Hot编码,又称为一位有效编码,主要是采用位状态寄存器来对个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。独热编码 是利用0和1表示一些参数,使用N位状态寄存器来对N个状态进行编码。
如本程序中对MNIST便签的热编码:
0,1,2,3,4,5,6,7,8,9的热编码
由于该数据集预先分割了训练数据集和测试数据集,我们仅需输入以下代码即可:
train_X = mnist.train.images
train_Y = mnist.train.labels
test_X = mnist.test.images
test_Y = mnist.test.labels
print(train_X.shape, train_Y.shape) # (55000, 784) (55000, 10)
print(test_X.shape, test_Y.shape) # (10000, 784) (10000, 10)
训练图片为55000张,28×28,训练标签为55000个,热编码为10位数字。
测试图片为10000张,28×28,测试标签为10000个,热编码为10位数字。
显示出第一个图片和标签及其数据类型:
print(train_X[0],type(train_X)) # <class 'numpy.ndarray'>
print(train_Y[0],type(train_Y)) # <class 'numpy.ndarray'>
numpy.ndarray:用于存放同类型的一个多维数组对象,每一个元素在内存中都具有相同大小的存储空间。
显示4张训练集的手写数字图片:
img = train_X[0].reshape(28, 28) # 转换图片格式
plt.subplot(221) # 图片布局为两行两列的第一个
plt.imshow(img, cmap='Greys') # camp='Greys'转换为灰度图片
img = train_X[1].reshape(28, 28)
plt.subplot(222)
plt.imshow(img, cmap='Greys')
img = train_X[2].reshape(28, 28)
plt.subplot(223)
plt.imshow(img, cmap='Greys')
img = train_X[3].reshape(28, 28)
plt.subplot(224)
plt.imshow(img, cmap='Greys')
plt.show()
结果展示:
完整代码:
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import matplotlib.pyplot as plt
import numpy as np
# 导入数据
mnist = input_data.read_data_sets('D:\pythonProject1\MNIST\MNIST_data',one_hot=True)
train_X = mnist.train.images
train_Y = mnist.train.labels
test_X = mnist.test.images
test_Y = mnist.test.labels
print(train_X.shape, train_Y.shape)
print(test_X.shape, test_Y.shape)
print(train_X[0],type(train_X))
print(train_Y[0],type(train_Y))
img = train_X[0].reshape(28, 28)
plt.subplot(221)
plt.imshow(img, cmap='Greys')
img = train_X[1].reshape(28, 28)
plt.subplot(222)
plt.imshow(img, cmap='Greys')
img = train_X[2].reshape(28, 28)
plt.subplot(223)
plt.imshow(img, cmap='Greys')
img = train_X[3].reshape(28, 28)
plt.subplot(224)
plt.imshow(img, cmap='Greys')
plt.show()
2.keras导入数据集
完整代码:
from keras.datasets import mnist
import matplotlib.pyplot as plt
import numpy as np
# 导入数据
(train_X, train_Y), (test_X, test_Y) = mnist.load_data()
plt.subplot(221)
plt.imshow(img, cmap='Greys')
plt.subplot(222)
plt.imshow(img, cmap='Greys')
plt.subplot(223)
plt.imshow(img, cmap='Greys')
plt.subplot(224)
plt.imshow(img, cmap='Greys')
plt.show()