Tensorflow有三种读取数据的方式:
- 定义placeholder占位符,通过feed_dict输入数据,从而实现数据的读取。(注意:程序运行时一定要给placeholder提供数据)
- 预加载数据:在tensorflow的计算图中,定义常量或变量来保存所有的数据。(这种方法不适合于数据量大的情况,会出现显卡内存不足的情况)
- 将数据保存到TFRecords文件,程序每次从TFRecords文件去读取数据,相当于每次从磁盘读取数据,适用于数据量大的情况。
这里主要介绍第一种和第三种数据读取方式。
- 定义placeholder占位符,通过feed_dict读取数据
- placeholder有以下两种定义方式:
第一种是直接给出了a的确定shape,在提供数据时,数据的shape只能是[2, 1];第二种方式,适用于模型训练时,训练样本数量不确定的情况,更具有灵活性,提供的数据可以是[2, 1] 也可以是[3, 1]。
- 通过下面的代码来给placeholder提供数据:
其中a_x,b_x和a, b同shape,a_x 和b_x是非张量的数组等形式。
2. 从TFRecords中读取数据
- 将数据写入TFRecords文件
TFRecords可以保存任意形式的数据,如文本,图像等。(因为时间有限,直接上代码)
通过以下代码来调用SeqtoTfrecord类,实现将数据写入TFRecord文件。
- 从TFRecord文件中读取数据
还是直接上代码
TFRecord在数据量大时非常适用,并且可以写入多种形式的数据,根据需要保存数据多种属性.