【tensorflow2.0】tf.data输入模块实例

最新推荐文章于 2021-09-03 23:15:26 发布

糊涂懿

最新推荐文章于 2021-09-03 23:15:26 发布

阅读量299

点赞数 1

分类专栏： tensorflow2.0 文章标签： tensorflow

本文链接：https://blog.csdn.net/XXXXXXJY/article/details/109499478

版权

tensorflow2.0 专栏收录该内容

21 篇文章 1 订阅

订阅专栏

准备工作：

import tensorflow as tf
#加载手写数字数据集
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()
#将数据集归一化
train_images = train_images / 255
test_images = test_images / 255

创建Dataset：

ds_train_img = tf.data.Dataset.from_tensor_slices(train_images)

ds_train_lab = tf.data.Dataset.from_tensor_slices(train_labels)

当显示shapes:()时，说明该数据为一个数字。

让创建的两个Dataset对应起来：

ds_train = tf.data.Dataset.zip((ds_train_img, ds_train_lab))

以元组的形式合并在一起，所以zip()函数里面还得再加一个括号。
此时，ds_train为一个ZipDataset，它的形状为((28, 28), ())，前面为一个28×28的图片，对应于train_images；后面是一个单独的数字，对应于train_labels。

然后再对数据统一做变换，就不用担心变换之后数据和标签不对应了。

ds_train = ds_train.shuffle(10000).repeat().batch(64)

取10000个组件进行乱序，然后无限重复，希望batch size为64，即每次输出64张图片以及对应的标签。

建立模型:

model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input=(28,28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

编译模型:

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

训练数据：
因为ds_train数据既包括图片，又包括对应的标签。所以直接训练ds_train数据即可。

model.fit(ds_train, epochs=5, steps_per_epoch = steps_per_epoch)

因为本数据是无限循环的，所以得告诉它循环多少次算是一个epoch。因为每次迭代是64张图片，一共有60000张图片，所以在此代码前加一段代码steps_per_epoch = train_images.shape[0] // 64，取整（因为这个数必须是整数）。

添加验证数据：
首先建立test的数据集

ds_test = tf.data.Dataset.from_tensor_slices((test_images, test_labels))

对model进行预测时，乱序变换并没有用处，训练时才有用。预测时也不需要重复变换，因为预测时默认是无限循环的。仅batch变换对预测有用。下面对数据进行batch变换设置

ds_test = ds_test.batch(64)

然后

model.fit(ds_train, epochs=5,steps_per_epoch = steps_per_epochs, 
          validation_data = ds_test， validation_steps =  10000//64)

设置了validation_data = ds_test， validation_steps = 10000//64，其中10000为ds_test的大小，64为之前设置的batch大小。

糊涂懿

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【tensorflow2.0】tf.data输入模块实例

准备工作：import tensorflow as tf#加载手写数字数据集(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()#将数据集归一化train_images = train_images / 255test_images = test_images / 255创建Dataset：ds_train_img = tf.data.Data...
复制链接

扫一扫