Tensorflow直接读取CSV文件
整理一下tensorflow读取csv文件的基本流程,主要是官方文档中的例子的记录。
tensorflow读取csv文件相对pandas要复杂一下,基本过程如下:
- 产生文件名列表,这里可以一次性用pipline读取一系列csv文件。
- 建立阅读器,读取原始数据。
- 解析读出的原始数据,转化成数值数据或指定格式的数据。
- 开启多线程协调器,启动输入管道。
读取完毕,停止请求。
选取iris数据集测试,iris2.csv是完全一样的一个文件,主要为了验证多文件读取的功能。有4个实数型属性和一个字符串性label。
import tensorflow as tf
import numpy as np
filename_queue = tf.train.string_input_producer(["./data/iris.csv", "./data/iris2.csv"])
reader = tf.TextLineReader()
key, value = reader.read(filename_queue)
#