Pandas数据导出

目录

一、导出为.xlsx文件

二、导出为.csv文件

三、导出多个Sheet


本文文章链接:Pandas数据导出-CSDN博客

一、导出为.xlsx文件

导出数据为Excel,主要使用DataFrame对象的
DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep=",float_format=None,columns=None,header=True,ine=None,merge_cells=True, encoding=None, inf_rep='inf,verbose=True,freeze_panes=None)
index=True,index_label=None,startrow=0,startcol=0,eng
verbose=True, freeze_panes=None)
参数说明:
excel writer:字符串或ExcelWriter对象。

sheet_name:字符串,默认值为Sheetl,包含DataFrame的表的名称。
na_rep:字符串,默认值为’。缺失数据的表示方式。
float_format:字符串,默认值为None,格式化浮点数的字符串。
columns:序列,可选参数,要编辑的列。
header:布尔型或字符串列表,默认值为True。列名称,如果给定字符串列表,则表示它是列名称的别名。
index:布尔型,默认值为True,行名(索引)。
index_label:字符串或序列,默认值为None。如果需要,可以使用索引列的列标签;如果没有给出,标题和索引为True,则使用索引名称;如果数据文件使用多索引,则需使用序列。
startrow:指定从哪一行开始写入数据。
startcol:指定从哪一列开始写入数据。
engine:字符串,默认值为None,指定要使用的写引擎,如openpyxl或xlsxwriter。也可以通过io.excel.xlsx.writer、io.excel.xls.writer和io.excel.xlsm.writer进行设置。
merge_cells:布尔型,默认值为True。
encoding:指定Excel文件的编码方式,默认值为None。
inf_rep:字符串,默认值为“正”,表示无穷大。
verbose:布尔型,默认值为True。在错误日志中显示更多信息。
freeze panes:整数的元组,长度2,默认值为None。指定要冻结的行列。
* 将处理后的数据导出为Excel文件。将数据合并后的结果导出为Excel文件,主要代码如下:

df_merge.to_excel('merge.xlsx')

运行程序,数据将导出为Excel文件,如图所示:

上述举例,如果需要指定Sheet页名称,可以通过sheet_name参数指定,主要代码如下:

df1.to_excel('df1.xlsx",sheet_name='df1')

二、导出为.csv文件

导出数据为.csv文件,主要使用DataFrame对象的to_csv语法,语法如下:

DataFrame.to_csv(path_or_buf=None,sep='na_rep="',float format=None,columns=None,header=True,index=True,index_label=None,mode=w,encoding=None,compression='infer,quoting=None,quotechar="",line_terminator=None,chunksize=None,date_format=None,doublequote=True,escapechar=None, decimal='.,errors='strict)

参数说明:
path_or_buf:要保存的路径及文件名。
sep:分隔符,默认值为”,”。
na_rep:指定空值的输出方式,默认值为空字符串。
float_format:浮点数的输出格式,要用双引号括起来。
columns:指定要导出的列,用列名列表表示,默认值为None。
header:是否输出列名,默认值为True。
index:是否输出索引,默认值为True。 
index_label:索引列的列名,默认值为None。
mode:Python写入模式,默认值为w。
encoding:编码方式,默认值为utf-8。
compression:压缩模式,默认值为infer。
quoting:导出.csv文件是否用引号,默认值为0,表示不加双引号;如果值为1,则每个字段都会加上引号,数值也会被当作字符串看待。
quotechar:引用字符,当quoting=1时可以指定引号字符为双引号(”")或单引号('")。line_terminator:换行符,默认值为\n。
chunksize:一次写入.csv文件的行数,当DataFrame对象数据特别大时需要分批写入。date format:日期输出格式。
doublequote:是否添加双引用符,默认值为True。
escapechar:设置转义字符。
decimal:可识别十进制分隔符的字符。
errors:指定如何处理编码和解码错误,默认值为strict(严格的)。
 

*将处理后的数据导出为.csv文件。下面介绍to csvo方法常用功能,举例如下,df为DataFrame对象。
(1)相对位置,保存在程序所在路径下,代码如下:

df.to_csv('Result.csv')


(2)绝对位置,代码如下:

df.to_csv('d:lResult.csv')


(3)分隔符。使用问号(?)分隔符分隔需要保存的数据,代码如下:

df.to_csv('Result.csv',sep='?")

(4))替换空值,缺失值保存为NA,代码如下:

df.to_csv('Result1.csv',na_rep='NA')


(5)格式化数据,保留两位小数,代码如下:

df.to_csv('Result1.csv',float_format="%.2f)


(6)保留某列数据,保存索引列和name列,代码如下:

df.to_csv('Result.csv',columns='name'])


(7)是否保留列名,不保留列名,代码如下:

df.to_csv('Result.csv',header=False)


(8)是否保留行索引,不保留行索引,代码如下:

df.to_csv('Result.csv'index=False)

三、导出多个Sheet

导出多个Sheet,应首先使用pd.ExcelWriter)方法打开一个Excel文件,然后再使用to_excel)方法导出指定的Sheet。
* 导出Excel中多个Sheet页的数据。导出指定Sheet页中的数据,主要代码如下:ben

01 df1.to_excel('df1.xlsx',sheet_name='df1')
02 work=pd.Exce/Writer('df2.xlsx") #打开一个Excel文件
03 df1.to_excel(work,sheet_name='df2')
04df1['A'].to_excel(work,sheet_name='df3")
05 work.save()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值