目录
-
学习目标
-
1.csv
- 1.读取--
pd.read_csv
usecols
– 需要哪列
- 2.存储 –
对象.to_csv
columns
– 保存哪列
- 1.读取--
-
2.hdf
- 1.读取 –
pd.read_hdf()
- 2.写入 –
对象.to_hdf()
- 注意:保存文件是****.h5
- 1.读取 –
-
3.json
- 1.读取 –
pd.read_json()
- 2.写入 –
对象.to_josn()
orient
– 按照什么方式进行读取或者写入lines
– 是否按照行读取和写入
- 1.读取 –
-
4.推荐使用hdf
- 1.压缩方式,读取效率快
- 2.压缩后,节省空间
- 3.支持跨平台
我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。
注:最常用的HDF5和CSV文件
1. CSV
1.1 read_csv
pandas.read_csv(filepath_or_buffer, sep =',' )
- filepath_or_buffer:文件路径
usecols
:指定读取的列名,列表形式
读取之前的股票的数据
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
'''
open close
2018-02-27 23.53 24.16
2018-02-26 22.80 23.53
2018-02-23 22.88 22.82
2018-02-22 22.25 22.28
2018-02-14 21.49 21.92
'''
1.2 to_csv
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
- path_or_buf :string or file handle, default None
- sep :character, default ‘,’
- columns :sequence, optional
- mode:‘w’:重写, ‘a’ 追加
- index:是否写进行索引
- header :boolean or list of string, default True,