tf.data.Dataset.zip()讲解 和 python自带的zip()的异同

Dataset

说到tf.data,哎那就是一个大话题,这个东西复杂的很,但是总的归根结底就是一个东西:Dataset数据。
关于学习tf.datatf.data.Dataset我一直认为仔细看源码,比看任何解释都好,因为源码其实是有解释的。
直接进入正题

dataset.zip()与zip()

这个函数和python中的zip()相当的不一样,切勿被迷惑了双眼。首先tensorflow中的zip接受的数据是dataset
作用:通过将给定的数据集压缩在一起创建一个“数据集”。
使用过程举例

a = Dataset.range(1, 4)  # ==> [ 1, 2, 3 ]
b = Dataset.range(4, 7)  # ==> [ 4, 5, 6 ]
c = Dataset.range(7, 13).batch(2)  # ==> [ [7, 8], [9, 10], [11, 12] ]
d = Dataset.range(13, 15)  # ==> [ 13, 14 ]


Dataset.zip((a, b))
# ==> [ (1, 4), (2, 5), (3, 6) ]
Dataset.zip((b, a))
# ==> [ (4, 1), (5, 2), (6, 3) ]

甚至还可以三个一起

Dataset.zip((a, b, c))  # ==> [ (1, 4, [7, 8]),
                            # (2, 5, [9, 10]),
                            # (3, 6, [11, 12]) ]

这是和Pythonzip有很大不一样的。
同样的代码,结果如下

a = [1,2,3]
b = [4,5,6]
c = range(13,15)
zip((a,b))
# ==> <zip at 0x7f515dcc19c8>
# 那我们打印看看
for x in d:
    print(x)
# ⇒ ([1, 2, 3],)
#   ([4, 5, 6],)

既然官方说是来源zip(),那么肯定可以用python实现dataset.zip()的代码的.如下:

a = [1,2,3]
b = [4,5,6]
for x in list(zip(a,b)):
    print(x)

$ outputs == >
(1, 4)
(2, 5)
(3, 6)

值得注意

所以正如官方说的通过将给定的数据集压缩在一起创建一个“数据集”。
但是一定要记住:这个数据集的最小元素就是整合后的单个元素

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值