Tensorflow2.0的tf.keras中batch()、map()、shuffle()、repeat()用法总结

小k同学！

于 2021-08-18 10:51:52 发布

阅读量1.7k

点赞数 2

分类专栏： Tensorflow 文章标签： python tensorflow numpy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/silent1cat/article/details/119773192

版权

Tensorflow 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

概述

1.batch()：batch在阴影数据时按size大小输出迭代。
2.map()：map用法和在Python中基本相同，接受一个函数对象参数，使用Dataset读取的每个数据都会被作为这个函数对象的参数进行计算输出，组成新的数据集。
3.shuffle()：shuffle作用于打乱数据集中的元素。
4.repeat()：repeat将数据集重复多次

用法

1.batch(size)

import tensorflow as tf
import numpy as np

dataset = tf.data.Dataset.from_tensor_slices(np.array([[0, 1, 2],[4, 5, 6]]))
dataset = dataset.batch(1)

for data in dataset:
    print(data)
    print("---")

OUT:
在这里插入图片描述
将size设置为2
OUT:

数据不足时则会输出全部剩余。

2.map()

dataset = tf.data.Dataset.from_tensor_slices({'data':np.array([1.0, 2.0, 3.0, 4.0, 5.0]),'index':np.random.uniform(size=(5,3))})

def get_new_dataset(dataset):
    data = dataset['data']
    index = dataset['index']
    return  data, index

dataset = dataset.map(get_new_dataset)
for data, index in dataset:
    print(data,"===",index)
    print("---")

OUT:
在这里插入图片描述
3.shuffle(buffer_size)
buffer_size：表示打乱数据集所使用的缓冲区的大小

import tensorflow as tf
import numpy as np

dataset = tf.data.Dataset.from_tensor_slices({'data':np.array([1.0, 2.0, 3.0, 4.0, 5.0]), 'index':np.random.uniform(size=(5,3))}).shuffle(buffer_size=10).batch(2)

for small_dataset in dataset:
    print(small_dataset['data'],"===",small_dataset['index'])
    print("---")

First OUT:
在这里插入图片描述
Second OUT:

4.repeat()

import tensorflow as tf
import numpy as np

dataset = tf.data.Dataset.from_tensor_slices({'data':np.array([1.0, 2.0, 3.0, 4.0, 5.0]), 'index':np.random.uniform(size=(5,3))}).shuffle(buffer_size=10).batch(2)
dataset = dataset.repeat(2)
for small_dataset in dataset:
    print(small_dataset['data'],"===",small_dataset['index'])
    print("---")

在这里插入图片描述

uniform的用法请参考：https://blog.csdn.net/silent1cat/article/details/119750523

希望这篇文章对大家有所帮助！

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
Tensorflow2.0的tf.keras中batch()、map()、shuffle()、repeat()用法总结

概述1.batch()：batch在阴影数据时按size大小输出迭代。2.map()：map用法和在Python中基本相同，接受一个函数对象参数，使用Dataset读取的每个数据都会被作为这个函数对象的参数进行计算输出，组成新的数据集。3.shuffle()：shuffle作用于打乱数据集中的元素。4.repeat()：repeat将数据集重复多次用法1.batch(size)import tensorflow as tfimport numpy as npdataset = tf.da
复制链接

扫一扫

专栏目录

博客等级

码龄4年

50
原创

398
点赞

1565
收藏

73
粉丝

关注

私信

热门文章

分类专栏

最新评论

np.random.uniform()函数用法总结
wwchgc: 这里第一个参数是随机数下限，第二个是随机数上限，第三个是产生啥样子的随机数
tf.keras.layers.Conv2D用法总结
皇家肆掠者: 我一个请教，fliters只指定个数，那具体过滤器矩阵啥样的，默认的吗
np.random.uniform()函数用法总结
l2071684556: CSDN的文章还是一如既往的低质量
np.random.uniform()函数用法总结
beatiful233: 写错了，size默认返回一个单一值
np.random.uniform()函数用法总结
beatiful233: 这里其实存在函数能处理low>high的情况。三个值的默认值分别为low：0，high：1，size：一个标量按作者这里的例子（6，3）其实是都是传给了low的，然后high取默认值1，但是这个函数考虑了low>high的情况，所以会分别输出位于1-6和1-3之间的两个值，建议可以自行用代码测试一下。参考了知乎相关回答。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小k同学！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。