pandas文件读取与存储(csv,excel,hdf5,json)

Pandas文件读取与存储

import pandas as pd

csv

1. 读取csv文件read_csv()


pd.read_csv('路径')

路径为必传参数
'''
read_csv还有两个参数
# usecols  当csv文件里面有多个字段(列索引),使用这个字段可以指定只读某些字段,列表格式
用法格式:
	pd.read_csv('路径', usecols=['字段1','字段2'...])

# names  当csv文件里面没有指定的索引时,读的时候可以使用该参数添加字段名
用法格式:
	pd.read_csv('路径', names=['字段A','字段B'...])
'''

2. 存储csv文件to_csv()

dataframe.to_csv('路径保存的文件名.csv')

dataframe表示数据Dataframe对象, Series数据用法一样

  • 参数
columns  指定要存入文件的字段
格式:
	dataframe.to_csv('路径.csv', columns=['字段1','字段2'...])
******************************************
index=False  默认为True,设置为false就是不存储行索引
格式: 
	dataframe.to_csv('路径.csv', index=False)
******************************************
mode 选择写入的方式'a','w'
格式: 
	dataframe.to_csv('路径.csv', mode='a')
******************************************
header=False 默认为True, 设置为false就是不存储列索引
格式:
	dataframe.to_csv('路径.csv', header=False)

HDF5

hdf5文件是一个二进制文件, 存放的是三维数据,就是存放dataframe这种二维数据的,所以读取和存储的时候需要指定一个键key,值为要存储的DataFrame

读取read_hdf()

pd.read_hdf('路径',key=None, **kwargs)

***********
key: 读取的键,如果该文件只有一个键,可以不写,否则必须
mode: 打开文件的模式

***********
如果读取失败,可能读取的时候需要tables插件
pip install tables

存储to_hdf()

dataframe.to_hdf('路径.h5',key="必须加")

********
存储的时候必须加上key,否则报错
********

JSON

每条json数据都是以大括号{}包着, 键值对形式存在,以逗号分隔,(如果以records方式读键就是列索引,就是字段)

读取read_json()

pd.read_json('路径', orient="records", lines=True)

******
orient='records' 为读取的一种形式,习惯上是这样写
line=True  按照每行读取json对象,默认是为False

存储to_json()


dataframe.to_json('路径.json', orient="records", lines=True)

存入的时候设置lines=True会把每个json对象进行分行处理
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值