Tensorflow可以使用feed_dict的方式输入数据,但是效率比较低。Tensorflow提供了一个内置函数可以利用输入管道的方式输入数据。
tf.data.Dataset()
接收numpy和tensor类型的数据
Dataset
Dataset()可以接收多个输入,当数据由特征和标签组成时,使用起来及其方便。
image_paths = ['特征路径']
label_paths = ['标签路径']
dataset = tf.data.Dataset.from_tensor_slices((image_paths, label_paths))
结果:
>>b'('特征路径', '标签路径')'
当输入为string
时,使用form_tensor_slices()
得到的结果是bytes
类型,可能需要decode('utf-8')
。
除了加载数据方便外,dataset
还可以做数据转换。dataset.map()
接收一个函数,Dataset
中的每个元素都会被当作这个函数的输入,并将函数返回值作为新的Dataset
。
dataset = tf.data.