tensorflow2读取数据P4: tf.data.TFRecordDataset创建Dataset

最新推荐文章于 2023-03-30 15:41:37 发布

象象家的小蜜桃

最新推荐文章于 2023-03-30 15:41:37 发布

阅读量283

点赞数

分类专栏： tensorflow2使用文章标签： tensorflow 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19069557/article/details/127624336

版权

tensorflow2使用专栏收录该内容

26 篇文章 10 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

为啥要用tfrecord

使用tfrecord是为了更高效地读取数据，这种方式比较适合数据量大且数据集相对稳定的情况。tfrecord将数据存储成了二进制记录序列的格式，这格式比较对计算机的胃口，读取更高效一些。
如果只是训练一点点数据，没必要存成tfrecord，因为这样带来的效率提升不够显著。
如果数据集里面的样本和标签时常有变动，也不太适合用tfrecord格式。因为数据集中样本和标签经常变动，可能是因为对任务的目标定位不够明确、数据集不够干净。这些数据存储成图片格式，方便进行查看和必要的改动。但存储成tfrecord格式，人工查看就不是很方便了。若是数据集较为干净、且任务定义明确，只是数据量在不断增长，还是比较适合存储成tfrecord的。

怎么制作tfrecord呢？

感觉有些复杂，为啥呢？因为制作tfrecord，数据大部分要经过2步转换。如下图所示，想存入tfrecord的数据，不管是数值、字符串还是图片，都得先变成正规军tf.train.Feature格式的数据。然后多个由关键字（string类型）和对应tf.train.Feature组成的字典生成tf.Example, 然后再序列化成二进制字符串，存储到文件中，大功告成。
真是太复杂了，为啥不能只输入一个路径，然后tensorflow自己分析里面有啥，然后存到tfrecord呢？（白日做梦）
现在就来实现以下这个过程。

了解本专栏

超级会员免费看

象象家的小蜜桃

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
tensorflow2读取数据P4: tf.data.TFRecordDataset创建Dataset

tensorflow2读取数据P4: tf.data.TFRecordDataset创建Dataset
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

象象家的小蜜桃 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。