在读取tensorlow tfrecord文件时,可以使用tensorflow直接读取,另外一种方法即使用slim中高级封装读取。
为了日后复习,今天记下其中Dataset定义。
Dataset为一个类,包括如下几个成员:
1.数据源列表
2.阅读器。阅读器能读取数据源,并且能尽量换回被编码的数据
3.解码器。解码器用来解码阅读器返回的每一个样例。
4.样例总数量。
5.可选字典。该字典映射返回项目的列表和这些项目的描述。数据可以通过slim中的dataset_data_provider从dataset中读取。如下所示:
dataset = CreateMyDataset(...)
provider = dataset_data_provider.DatasetDataProvider(
dataset, shuffle=False)
image, label = provider.get(['image', 'label'])