python3使用pandas库处理excel文件

最新推荐文章于 2023-12-26 11:29:20 发布

橙木

最新推荐文章于 2023-12-26 11:29:20 发布

阅读量861

点赞数

文章标签： pandas excel python

本文链接：https://blog.csdn.net/weixin_43882507/article/details/127406977

版权

Pandas介绍

Pandas 是基于 NumPy 的一个开源 Python 库，它被广泛用于快速分析数据，以及数据清洗和准备等工作。它的名字来源是由“ Panel data”（面板数据，一个计量经济学名词）两个单词拼成的。简单地说，你可以把 Pandas 看作是 Python 版的 Excel

Pandas使用中的一些技巧内容

读取

对于处理excel文件，我们首先需要将excel文件中的内容载入到内存中，读取常用的函数名为：read_excel
示例代码

import pandas as pd
#xls_file为文件路径，usecols为读取的数据列抬头
#注意以此种方式读取的数据会自动加一个索引列
#例如原数据为 A     B     C
#			 data1 data2 data3
#			 data4 data5 data6
#按照如下方式读取会得到： A     B     C
#					 1 data1 data2 data3
#			 		 2 data4 data5 data6
data_xls = pd.read_excel(xls_file,usecols=list_name)

#同时值得注意的是usecols参数内容填写的list_name虽然可以提取到属于list_name中的内容，但是会按照读取的列名顺序来读取
#例如列名为 A B C D E
#list_name = ["B","C","A"]
#则读取到的data_xls内容依旧为 A B C

保存

保存数据内容有很多种方式
①to_csv

DataFrame.to_csv(path_or_buf, sep=', ', na_rep='', float_format=None, cols=None, header=True, index=True, index_label=None, mode='w', nanRep=None, encoding=None, quoting=None, line_terminator='n', chunksize=None, tupleize_cols=False, date_format=None, **kwds)

②to_xml

DataFrame.to_xml(path_or_buffer=None, index=True, root_name='data', row_name='row', na_rep=None, attr_cols=None, elem_cols=None, namespaces=None, prefix=None, encoding='utf-8', xml_declaration=True, pretty_print=True, parser='lxml', stylesheet=None, compression='infer', storage_options=None)

③to_excel

to_excel(excel_writer，sheet_name=‘sheet1’，na_rep=’ ’ ，float_format=None，columns=None，header=True，index=True，index_label=None，startrow=0，startcol=0，engine=None，merge_cells=True，encoding=None，inf_rep=‘inf’，verbose=True，freeze_panes=None)

橙木

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python3使用pandas库处理excel文件

Pandas 是基于 NumPy 的一个开源 Python 库，它被广泛用于快速分析数据，以及数据清洗和准备等工作。它的名字来源是由“ Panel data”（面板数据，一个计量经济学名词）两个单词拼成的。简单地说，你可以把 Pandas 看作是 Python 版的 Excel。
复制链接

扫一扫