关于Pandas的文件导入输出

一、pandas是什么?

Pandas是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。

二、Panda IO工具

Pandas I / O API是一组顶级reader函数访问,如pandas.read_csv(),通常返回一个pandas对象。相应的writer函数是对象方法,其访问方式类似于 DataFrame.to_csv()。

1.常用Reader和Writer函数

我们经常用到的Reader和Writer函数如下表所示

格式类型文件格式文件导入函数文件输出函数
textCSVread_csvto_csv
textJSONread_jsonto_json
textHTMLread_htmlto_html
MS EXCELread_excelto_excel
binarySPSSread_spss

2.read_csv常用相关参数

  1. filepath_or_buffer : 文件路径,可以是URL,可用URL类型包括:http, ftp, s3和文件,也可以使用本地绝对路径或者相对路径。此参数是必备参数,是文件的来源.
  2. header:指定行数用来作为列名,数据开始的行数。如果文件中没有列名,则默认为0。若header=0,表示数据第一行作为标题行。当header=None时,表示数据没有列索引,需要自己给定索引名,或者函数会自己加上自动加上列索引。
  3. namesindex_col:可以实现自己定义行索引的列名(index_col)和结果的列索引(names),names参数一般为列表形式.
  4. usecols: 函数将读取usecols指定列,得注意一下索引从0开始。

使用示例如下所示:

import pandas as pd
names = ['B', 'A', 'R', 'I', 'O']
df = pd.read_csv('text.py', header = None, names = names,usecols = [0, 1, 2, 3, 4, 5])

以上的路径为相对路径,python文件应与text.py于统一目录下才可以读取成功。
以上只是列举了比较常用的几个参数,还有许多许多参数,需要的话可以参考官方文档

通过reader函数得到的数据即为pandas特有的数据类型Series、DataFrame。另外,在使用writer函数时也有类似的参数(一般只需要文件路径filepath_or_buffer参数即可),此时也需要使用该类型的数据格式。

总结

第一次写博客,写得不太好的地方还请多多包涵。在数据分析,爬虫爬取得到的乱七八糟的数据中,pandas提供的强大的数据处理功能让我十分愉快。希望我能够在之后学习的过程中慢慢消化知识,分享知识,也欢迎大家多多和我交流 bario.tan@qq.com

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值