基于tensorflow2.0的mnist数据集实战（CNN）

最新推荐文章于 2024-09-11 17:21:00 发布

为人名日益增长的美好生活需要读书

最新推荐文章于 2024-09-11 17:21:00 发布

阅读量4.5k

点赞数 6

文章标签： tensorflow pytorch 神经网络

本文链接：https://blog.csdn.net/woshinierye/article/details/105141631

版权

本文介绍了使用TensorFlow2.0在MNIST数据集上实现CNN模型的过程，包括数据集获取、预处理、模型构建以及运行环境的建议。

摘要由CSDN通过智能技术生成

MNIST数据集简介:
MNIST数据集是用于训练邮政编码数字识别的数据集，其包括60000条训练数据与10000条测试数据，是Lecun与1998年制作的。每条数据样本都是28X28像素的。部分数据样本如下图所示：在这里插入图片描述
他是NIST数据库的一个子集。MNIST数据库的官方下载网址为：
http://yann.lecun.com/exdb/mnist/

数据集的获取

对于数据集的获取可以从网站下载，也可以用tensorflow2.0中集成的keras高级API对其进行载入和计算。代码如下：

mnist=tf.keras.datasets.mnist
(x_train,y_train),(x_test,y_test)=mnist.load_data()

数据处理
首先对label进行one-hot处理，之后用tf2.0自带的dataAPI进行打包，组合成train 与label的对应数据集。我们下载下来的数据集的张量形式为三维的，[x,28,28]但在CNN中数据张量形式为四维的，[batch,hight,width,channels],所以需要对原始数据进行增维处理

x_train=tf.expand_dims(x_train,-1) #-1表示增加的是第四维
x_test=tf.expand_dims(x_test,-1)
y_train=np.float32(tf.keras.utils.to_categorical(y_train,num_classes=10))
y_test=np.float32(tf.keras.utils.to_categorical(y_test,num_classes=10))
batch_size=512
train_dataset=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(batch_size).shuffle(batch_size*10)
test_dataset=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(batch_size)
#注：tf.expand_dims()为增加维度的函数，里面含有俩参数，