python pandas模块读取excel_利用python的pandas库读取excel数据文件数据

数据文件格式有xlsx、xls、csv,利用pandas库可将数据文件读取到python中,亦可将python处理好的数据导出为excel文件。

读取xlsx、xls文件

pandas.read_excel()语法的参数如下:

pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,

names=None,arse_cols=None,date_parser=None,na_values=None,

thousands=None,convert_float=True,has_index_names=None,converters=None,dtype=None,true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

参数讲解:

io:待读取数据文件的绝对路径,如'C:\Users\moka1\Desktop\111.xlsx',读取的是 111.xlsx这个数据文件。

sheetname:excel工作簿中往往会有多张工作表,该参数是用来指定具体工作表的,python一次只能读取一个工作表,如sheetname='Sheet1',默认参数0,表示只读取excel中的第一张工作表。

header:指定作为列名的行,默认是0,即excel的第一行;若数据不含列名,则设定header=None,python将会用数字命名列名;

names:指定列的名字,需以列表的形式设置;与header的区别在于,names是先将数据读取后,通过python生成的列名,不同于header的列名在excel数据文件中;

skiprows:excel中自上而下忽略读取的行数,用来从头部跳行读取数据;

skip_footer:自下而上忽略读取的行数,用来尾部跳行读取数据;

index_col:指定列为索引;

na_values:设置缺失值的处理,默认为None,可通过该参数设置为其他替换字符或数字;

导出为xlsx、xls文件

df.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None)

df:为python中dataframe数据

excel_writer:待保存的数据文件路径及名称;如,'C:\Users\moka1\Desktop\111.xlsx',保存到桌面为111.xlsx数据文件;

sheet_name:指定保存到excel文件中的哪张工作表,且可命名工作表名称;

index:是否保存行索引,默认为True,因为excel中会自动生成行索引,该列可设置为False;

写在最后

希望以上的内容能对你有所帮助,后续我们也将持续推出实用干货,感谢点赞和关注。

欢迎关注我的专栏:

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值