一、文件的读取和写入
- 文件读取
pandas可以读取的文件格式有很多,这里主要介绍读取csv, excel, txt文件。
常用的公共参数有:
1.header=None表示第一行不作为列名
2.index_col表示把某一列或几列作为索引
3.usecols表示读取列的集合,默认读取所有的列,
4.parse_dates表示需要转化为时间的列,
5.nrows表示读取的数据行数
在读取txt文件时,经常遇到分隔符非空格的情况,read_table有一个分割参数sep,它使得用户可以自定义分割符号,进行txt数据的读取。
结果不是理想的,这时可以使用sep,同时需要指定引擎为python:
sep是正则参数
在使用read_table的时候需要注意,参数sep中使用的是正则表达式,因此需要对|进行转义变成|,否则无法读取到正确的结果。
2. 数据写入
一般在数据写入中,最常用的操作是把index设置为False,特别当索引没有特殊意义的时候,这样的行为能把索引在保存的时候去除。