工具篇-csv文件读写

目的:在Python处理数据的很多时候,需要加载文件,通常还是csv格式,希望加载之后是个二维列表/数组,这样才方便处理;
1. 简单的api能够导入数据到内存中
2. 能够适应复杂&大数据量机器学习的场景

Pandas

csv
import pandas as pd;
import numpy as np;
df = pd.read_csv("FILE_NAME");
np.array(df);

Tensorflow

queue
todo
TFRecords
填入&保存Feature
with tf.python_io.TFRecordWriter(FILE_NAME) as writer:
  for data in balabla:
    feature_data = GET_DATA()
    example = tf.train.Example(
      features = tf.train.Features(
        feature={'key_1':tf.train.Feature(int64_list=tf.train.Int64List(value=[value])),
                 'key_2':tf.train.Feature(int64_list=tf.train.BytesList(value=[value]))}))
    writer.write(example.SerializeToString())
加载&读取Feature
filename_queue = tf.train.string_input_producer([filename])
reader = tf.TFRecordReader()
_, serialized_example = reader.read(filename_queue)
features = tf.parse_single_example(serialized_example,
           features = {'key_1': tf.FixedLenFeature([], tf.int64)
                       'key_2': tf.FixedLenFeature([], tf.string)})
feas = tf.decode_raw(features['key_1'], tf.uint8)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值