关于Pandas的文件导入输出

最新推荐文章于 2023-08-11 11:58:26 发布

BARIOTAN

最新推荐文章于 2023-08-11 11:58:26 发布

阅读量621

点赞数 2

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_44179954/article/details/108911350

版权

4 篇文章 0 订阅

订阅专栏

一、pandas是什么？

Pandas是一个开源的，BSD许可的库，为Python编程语言提供高性能，易于使用的数据结构和数据分析工具。

Pandas I / O API是一组顶级reader函数访问，如pandas.read_csv()，通常返回一个pandas对象。相应的writer函数是对象方法，其访问方式类似于 DataFrame.to_csv()。

我们经常用到的Reader和Writer函数如下表所示

格式类型	文件格式	文件导入函数	文件输出函数
text	CSV	read_csv	to_csv
text	JSON	read_json	to_json
text	HTML	read_html	to_html
	MS EXCEL	read_excel	to_excel
binary	SPSS	read_spss

filepath_or_buffer : 文件路径，可以是URL，可用URL类型包括：http, ftp, s3和文件，也可以使用本地绝对路径或者相对路径。此参数是必备参数，是文件的来源.
header：指定行数用来作为列名，数据开始的行数。如果文件中没有列名，则默认为0。若header=0，表示数据第一行作为标题行。当header=None时，表示数据没有列索引，需要自己给定索引名，或者函数会自己加上自动加上列索引。
names和index_col:可以实现自己定义行索引的列名（index_col)和结果的列索引(names)，names参数一般为列表形式.
usecols: 函数将读取usecols指定列，得注意一下索引从0开始。

使用示例如下所示：

import pandas as pd
names = ['B', 'A', 'R', 'I', 'O']
df = pd.read_csv('text.py', header = None, names = names,usecols = [0, 1, 2, 3, 4, 5])

以上的路径为相对路径，python文件应与text.py于统一目录下才可以读取成功。
以上只是列举了比较常用的几个参数，还有许多许多参数，需要的话可以参考官方文档

通过reader函数得到的数据即为pandas特有的数据类型Series、DataFrame。另外，在使用writer函数时也有类似的参数（一般只需要文件路径filepath_or_buffer参数即可），此时也需要使用该类型的数据格式。

第一次写博客，写得不太好的地方还请多多包涵。在数据分析，爬虫爬取得到的乱七八糟的数据中，pandas提供的强大的数据处理功能让我十分愉快。希望我能够在之后学习的过程中慢慢消化知识，分享知识，也欢迎大家多多和我交流 bario.tan@qq.com。

关注

专栏目录