怎么获取UNKNOWN_CARDINALITY的数据集的元素个数

当数据集的cardinality返回UNKNOWN_CARDINALITY时,可通过遍历数据集或使用reduce方法来获取元素个数。对于固定维度张量的数据集,可以简单地通过遍历计数;而对于非张量数据,如.tfrecord文件,可以使用dataset.reduce(0, lambda x, _: x + 1)来计算。但这些方法在大数据集上可能消耗较多时间。
摘要由CSDN通过智能技术生成

怎么获取UNKNOWN_CARDINALITY的数据集的元素个数

  本文参考该问答,其问答中给出了很多种解决方案。有些数据集使用dataset.cardinality().numpy()会返回-2,即UNKNOWN_CARDINALITY,这是因为你对该数据集进行了一些特殊操作。那么这种情况下该如何获取该数据集的元素个数呢。
  因为有的数据集中的元素是固定维度的张量,该类数据集比较好获得元素个数,使用如下代码遍历即可。

i = 0
for element in dataset:
    i += 1
print('dataset\'s elements num is %d'%i)

  但是有些存储的并不是张量,有可能是直接读取的.tfrecord文件,那么需要使用下面一条指令获取。

count = dataset.reduce(0, lambda x, _: x + 1)

  但这所有的方法都是需要遍历数据集,所以如果数据集比较大,有可能会消耗很多时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值