Pandas文件读写操作

文件操作:

Pandas中提供了许多的操作文件的函数,包括读取和写入。我们做数据分析用得最多的,就是CSVExcelSQLJSON文件。下面来针对这几种文件的操作做一个详细的讲解。

CSV文件操作:

读写CSV文件分别用的是pd.read_csvpd.to_csv方法。普通用法非常简单,但是通过一些参数,可以实现许多高级操作。

1. 读取csv:

读取csv用的是pd.read_csv,主要有以下参数:

  1. filepath_or_buffer:文件路径,或者是有read方法的流对象。
  2. sep:分隔符,默认是,
  3. header:指定哪行作为列的名称,如果没有行作为列名,那么应该设置header=None,并且设置names参数。
  4. names:在csv文件中没有一行来存储列名,可以使用names自己指定,并且设置header=None。
  5. index_col:使用哪一列作为行索引,可以是列的位置,也可以是列的名称。如果没有指定,那么默认会自动生成一个顺序索引。
  6. usecols:加载哪几列。比如有时候只想要csv文件中的某几列,那么就可以使用usecols。也可以是个函数,这个函数返回True的列会被保留,否则会丢弃。
  7. engine:csv解析引擎,有C和Python,C速度更快,但是Python功能更完善。
  8. dtype:指定某些列的类型。
  9. converters:转换器列表,可以指定每一列在加载的时候就转换为指定的类型。
  10. encoding:使用指定的编码方式打开文件。
  11. chunksize:使用迭代器的方式读取,一次返回多少行的数据。

更多参数请查看Pandas官网read_csv:https://pandas.pydata.org/docs/user_guide/io.html#io-read-csv-table

2. 写入csv:

写入csv用的是pd.to_csvSeri

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值