Pandas数据导出

网络系统管理员ChinaSkills

已于 2023-12-06 21:47:55 修改

阅读量388

点赞数

文章标签： pandas

于 2023-12-06 21:41:37 首次发布

本文链接：https://blog.csdn.net/weixin_46183247/article/details/134841365

版权

一、导出为.xlsx文件

二、导出为.csv文件

三、导出多个Sheet

本文文章链接：Pandas数据导出-CSDN博客

一、导出为.xlsx文件

导出数据为Excel，主要使用DataFrame对象的
DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep=",float_format=None,columns=None,header=True,ine=None,merge_cells=True, encoding=None, inf_rep='inf,verbose=True,freeze_panes=None)
index=True,index_label=None,startrow=0,startcol=0,eng
verbose=True, freeze_panes=None)
参数说明：
excel writer:字符串或ExcelWriter对象。

sheet_name:字符串，默认值为Sheetl，包含DataFrame的表的名称。
na_rep:字符串，默认值为’。缺失数据的表示方式。
float_format:字符串，默认值为None，格式化浮点数的字符串。
columns：序列，可选参数，要编辑的列。
header:布尔型或字符串列表，默认值为True。列名称，如果给定字符串列表，则表示它是列名称的别名。
index:布尔型，默认值为True，行名(索引)。
index_label:字符串或序列，默认值为None。如果需要，可以使用索引列的列标签；如果没有给出，标题和索引为True，则使用索引名称；如果数据文件使用多索引，则需使用序列。
startrow:指定从哪一行开始写入数据。
startcol：指定从哪一列开始写入数据。
engine:字符串，默认值为None，指定要使用的写引擎，如openpyxl或xlsxwriter。也可以通过io.excel.xlsx.writer、io.excel.xls.writer和io.excel.xlsm.writer进行设置。
merge_cells:布尔型，默认值为True。
encoding:指定Excel文件的编码方式，默认值为None。
inf_rep:字符串，默认值为“正”，表示无穷大。
verbose:布尔型，默认值为True。在错误日志中显示更多信息。
freeze panes:整数的元组，长度2，默认值为None。指定要冻结的行列。
* 将处理后的数据导出为Excel文件。将数据合并后的结果导出为Excel文件，主要代码如下:

df_merge.to_excel('merge.xlsx')

运行程序，数据将导出为Excel文件，如图所示：

上述举例，如果需要指定Sheet页名称，可以通过sheet_name参数指定，主要代码如下：

df1.to_excel（'df1.xlsx",sheet_name='df1')

二、导出为.csv文件

导出数据为.csv文件，主要使用DataFrame对象的to_csv语法，语法如下：

DataFrame.to_csv(path_or_buf=None,sep='na_rep="',float format=None,columns=None,header=True,index=True,index_label=None,mode=w,encoding=None,compression='infer,quoting=None,quotechar="",line_terminator=None,chunksize=None,date_format=None,doublequote=True,escapechar=None, decimal='.,errors='strict)

参数说明：
path_or_buf：要保存的路径及文件名。
sep：分隔符，默认值为”，”。
na_rep:指定空值的输出方式，默认值为空字符串。
float_format:浮点数的输出格式，要用双引号括起来。
columns:指定要导出的列，用列名列表表示，默认值为None。
header:是否输出列名，默认值为True。
index：是否输出索引，默认值为True。
index_label：索引列的列名，默认值为None。
mode:Python写入模式，默认值为w。
encoding：编码方式，默认值为utf-8。
compression:压缩模式，默认值为infer。
quoting:导出.csv文件是否用引号，默认值为0，表示不加双引号；如果值为1，则每个字段都会加上引号，数值也会被当作字符串看待。
quotechar:引用字符，当quoting=1时可以指定引号字符为双引号(”")或单引号('")。line_terminator：换行符，默认值为\n。
chunksize:一次写入.csv文件的行数，当DataFrame对象数据特别大时需要分批写入。date format:日期输出格式。
doublequote:是否添加双引用符，默认值为True。
escapechar:设置转义字符。
decimal：可识别十进制分隔符的字符。
errors:指定如何处理编码和解码错误，默认值为strict(严格的)。

*将处理后的数据导出为.csv文件。下面介绍to csvo方法常用功能，举例如下，df为DataFrame对象。
(1)相对位置，保存在程序所在路径下，代码如下：

df.to_csv('Result.csv')

(2)绝对位置，代码如下：

df.to_csv('d:lResult.csv')

(3)分隔符。使用问号(?)分隔符分隔需要保存的数据，代码如下：

df.to_csv('Result.csv',sep='?")

（4）)替换空值，缺失值保存为NA，代码如下：

df.to_csv('Result1.csv',na_rep='NA')

(5)格式化数据，保留两位小数，代码如下：

df.to_csv('Result1.csv',float_format="%.2f)

(6)保留某列数据，保存索引列和name列，代码如下：

df.to_csv('Result.csv',columns='name'])

(7)是否保留列名，不保留列名，代码如下：

df.to_csv('Result.csv',header=False)

(8)是否保留行索引，不保留行索引，代码如下：

df.to_csv('Result.csv'index=False)

三、导出多个Sheet

导出多个Sheet，应首先使用pd.ExcelWriter)方法打开一个Excel文件，然后再使用to_excel)方法导出指定的Sheet。
* 导出Excel中多个Sheet页的数据。导出指定Sheet页中的数据，主要代码如下：ben

01 df1.to_excel('df1.xlsx',sheet_name='df1')
02 work=pd.Exce/Writer('df2.xlsx") #打开一个Excel文件
03 df1.to_excel(work,sheet_name='df2')
04df1['A'].to_excel(work,sheet_name='df3")
05 work.save()

网络系统管理员ChinaSkills

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Pandas数据导出

engine:字符串，默认值为None，指定要使用的写引擎，如openpyxl或xlsxwriter。导出多个Sheet，应首先使用pd.ExcelWriter)方法打开一个Excel文件，然后再使用to_excel)方法导出指定的Sheet。将处理后的数据导出为.csv文件。sheet_name:字符串，默认值为Sheetl，包含DataFrame的表的名称。float_format:字符串，默认值为None，格式化浮点数的字符串。columns:指定要导出的列，用列名列表表示，默认值为None。
复制链接

扫一扫

Pandas数据导出

本文文章链接：Pandas数据导出-CSDN博客

一、导出为.xlsx文件

二、导出为.csv文件

三、导出多个Sheet

“相关推荐”对你有帮助么？