13.tf.data使用实例

最新推荐文章于 2022-08-21 23:41:51 发布

Suyuoa

最新推荐文章于 2022-08-21 23:41:51 发布

阅读量155

点赞数

分类专栏： tensorflow笔记文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/potato123232/article/details/120566515

版权

tensorflow笔记专栏收录该内容

48 篇文章 26 订阅

订阅专栏

目录

2 加载数据集

4 创建数据集

4.1 创建训练图片数据集

4.2 创建训练标签数据集

4.3 把这两个数据集合并到一起

5 处理训练集

5.3 设置批次

6 创建测试集

1 导入库

2 加载数据集

我们这次换为mnist数据集，这个数据集是手写数字的数据集

3 归一化

我们此时看一下train_iamge的shape

4 创建数据集

4.1 创建训练图片数据集

我们看一下我们的图片数据集

4.2 创建训练标签数据集

我们同样看一下

4.3 把这两个数据集合并到一起

我们想把这两个数据合并成元组的形式，所以要额外加一个括号

看一下合并后的数据集

5 处理训练集

5.1 乱序

乱序个数我们现在设置为10000，这个数是随便选的，我们一共有60000张图片，全部乱序会影响速度，乱序太少会没有效果

5.2 重复

我们令其无限次重复

5.3 设置批次

我们将其设置为一批64个

6 创建测试集

测试集后面给validation_data用的，能更加准确的获取acc与loss

我们在创建的时候这样写就行

看一下这个测试集

我们没有必要对test数据集进行乱序，因为测试集仅在前向转播时使用，不会对其余参数造成影响，由于测试集不用随机，那么测试集也就不用重复，训练集重复的意义是每一次重复都是随机顺序的数据，我们唯一就是需要将测试集的batch调整至与训练集相同的batch值

如果内存够大batch也不用改，对于mnist这个数据量小的数据集来讲batch是不需要添加的

7 建立模型

8 编译模型

sparse_categorical_crossentropy我们从上面的shape可以看出来，train_label是由单一的数组成的，所以此处的loss使用sparse_categorical_crossentropy

9 训练模型

因为我们上面定义了batch，所以我们在这里要使用steps_per_epochs(每个epochs的步数)，如果我们不加入这个就会导致我们只训练64个数据，如果加上了这个就会第一批训练64个，然后第二批再训练64个

由于ds_test默认为无限循环，所以我们要加入validation_steps这个参数，这个参数的值是测试集个数 // batch

train_image.shape[0]是训练图片的总个数，在这里是60000，test_image.shape[0]是测试图片的个数，这里是10000
步数这里注意一定要是整数，不然会报错

后面我们可以用这个模型进行评估与预测，我们就不在这赘述了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
13.tf.data使用实例

目录1导入库2加载数据集3归一化4创建数据集4.1创建训练图片数据集4.2创建训练标签数据集4.3把这两个数据集合并到一起5处理训练集5.1乱序5.2重复5.3设置批次6创建测试集7建立模型8编译模型9训练模型1导入库2加载数据集我们这次换为mnist数据集，这个数据集是手写数字的数据集3归一化我们此时看一下train_iamge的shape...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Suyuoa 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。