【Pandas】文件读取与存储

最新推荐文章于 2024-05-02 05:48:35 发布

Zero400

最新推荐文章于 2024-05-02 05:48:35 发布

阅读量595

点赞数 1

分类专栏： Pandas 文章标签：自然语言处理数据挖掘深度学习

本文链接：https://blog.csdn.net/CharlieTang123/article/details/107793117

版权

学习目标
1.csv
- 1.读取-- pd.read_csv
  - usecols – 需要哪列
- 2.存储 – 对象.to_csv
  - columns – 保存哪列
2.hdf
- 1.读取 – pd.read_hdf()
- 2.写入 – 对象.to_hdf()
  - 注意:保存文件是****.h5
3.json
- 1.读取 – pd.read_json()
- 2.写入 – 对象.to_josn()
  - orient – 按照什么方式进行读取或者写入
  - lines – 是否按照行读取和写入
4.推荐使用hdf
- 1.压缩方式,读取效率快
- 2.压缩后,节省空间
- 3.支持跨平台

我们的数据大部分存在于文件当中，所以pandas会支持复杂的IO操作，pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。

注：最常用的HDF5和CSV文件

在这里插入图片描述

1. CSV

1.1 read_csv

pandas.read_csv(filepath_or_buffer, sep =',' )
- filepath_or_buffer:文件路径
- usecols:指定读取的列名，列表形式

读取之前的股票的数据

# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])

'''
				open		close
2018-02-27		23.53		24.16
2018-02-26		22.80		23.53
2018-02-23		22.88		22.82
2018-02-22		22.25		22.28
2018-02-14		21.49		21.92
'''

1.2 to_csv

DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
- path_or_buf :string or file handle, default None
- sep :character, default ‘,’
- columns :sequence, optional
- mode:‘w’：重写, ‘a’ 追加
- index:是否写进行索引
- header :boolean or list of string, default True,是否写进列索引值

1.3 案例

最低0.47元/天解锁文章

Zero400

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【Pandas】文件读取与存储

目录1. CSV1.1 read_csv1.2 to_csv1.3 案例2. HDF52.1 read_hdf2.2 to_hdf3. JSON3.1 read_json3.2 to_json4. 拓展学习目标了解Pandas的几种文件读取存储操作应用CSV方式和HDF方式实现文件的读取和存储我们的数据大部分存在于文件当中，所以pandas会支持复杂的IO操作，pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。注：最常用的HDF5和CSV文件
复制链接

扫一扫

专栏目录