import tensorflow as tf
1.一维列表建立的Dataset
(1)建立一个Dataset:
dataset = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6, 7])
dataset
输出结果为<TensorSliceDataset shapes: (), types: tf.int32>,
其中的shapes表示每一个元素的形状,在本示例中就是一个数字,所以括号里面没有显示。
(2)使用这个Dataset(直接进行迭代):
for ele in dataset:
print(ele)
结果为:
它将输入的每个数都转换成了tf.Tensor这种数据类型。
可以将这些数据类型转换为numpy:
for ele in dataset:
print(ele.numpy())
输出结果为:
.numpy()
直接将一个Tensor数据类型转换为numpy数据类型,然后输出。
2.多维列表建立的Dataset
dataset = tf.data.Dataset.from_tensor_slices([[1, 2], [3, 4], [5, 6]])
这是一个含有三个元素的二维列表,其shape为2,这个2代表Dataset中每个组件的shape。
for ele in dataset:
print(ele.numpy())
输出结果为:
3.字典建立的Dataset
dataset_dict = tf.data.Dataset.from_tensor_slices({'a':[1,2,3,4],
'b':[6,7,8,9],
'c':[12,13,14,15]
})
迭代:
for ele in dataset_dict:
print(ele)
结果为:
它有4个element,也就是有4个字典。第一个字典中a的值为1,b的值为6,c的值为12;第二个字典中a的值为2,b的值为7,c的值为13;第三个字典中a的值为3,b的值为8,c的值为14;第四个字典中a的值为4,b的值为9,c的值为15.
4.数组建立的Dataset
import numpy as np
dataset_array = tf.data.Dataset.from_tensor_slices(np.array([1, 2, 3, 4, 5, 6, 7]))
for ele in dataset_array:
print(ele)
结果为:
若想取出其中的前几项,使用dataset_array.take()方法:
for ele in dataset_array.take(4):
print(ele.numpy())
结果为:
取出了dataset_array里面的前四个组件。
若想使用第一项,
next(iter(dataset_array.take(1)))
结果为:
其实很少使用这个方法,一般都使用for循环来迭代。