怎么获取UNKNOWN_CARDINALITY的数据集的元素个数
本文参考该问答,其问答中给出了很多种解决方案。有些数据集使用dataset.cardinality().numpy()
会返回-2,即UNKNOWN_CARDINALITY,这是因为你对该数据集进行了一些特殊操作。那么这种情况下该如何获取该数据集的元素个数呢。
因为有的数据集中的元素是固定维度的张量,该类数据集比较好获得元素个数,使用如下代码遍历即可。
i = 0
for element in dataset:
i += 1
print('dataset\'s elements num is %d'%i)
但是有些存储的并不是张量,有可能是直接读取的.tfrecord文件,那么需要使用下面一条指令获取。
count = dataset.reduce(0, lambda x, _: x + 1)
但这所有的方法都是需要遍历数据集,所以如果数据集比较大,有可能会消耗很多时间。