数据文件格式有xlsx、xls、csv,利用pandas库可将数据文件读取到python中,亦可将python处理好的数据导出为excel文件。
读取xlsx、xls文件
pandas.read_excel()语法的参数如下:
pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,
names=None,arse_cols=None,date_parser=None,na_values=None,
thousands=None,convert_float=True,has_index_names=None,converters=None,dtype=None,true_values=None,false_values=None,engine=None,squeeze=False,**kwds)
参数讲解:
io:待读取数据文件的绝对路径,如'C:\Users\moka1\Desktop\111.xlsx',读取的是 111.xlsx这个数据文件。
sheetname:excel工作簿中往往会有多张工作表,该参数是用来指定具体工作表的,python一次只能读取一个工作表,如sheetname='Sheet1',默认参数0,表示只读取excel中的第一张工作表。
header:指定作为列名的行,默认是0,即excel的第一行;若数据不含列名,则设定header=None,python将会用数字命名列名;
names:指定列的名字,需以列表的形式设置;与header的区别在于,names是先将数据读取后,通过python生成的列名,不同于header的列名在excel数据文件中;
skiprows:excel中自上而下忽略读取的行数,用来从头部跳行读取数据;
skip_footer:自下而上忽略读取的行数,用来尾部跳行读取数据;
index_col:指定列为索引;
na_values:设置缺失值的处理,默认为None,可通过该参数设置为其他替换字符或数字;
导出为xlsx、xls文件
df.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None)
df:为python中dataframe数据
excel_writer:待保存的数据文件路径及名称;如,'C:\Users\moka1\Desktop\111.xlsx',保存到桌面为111.xlsx数据文件;
sheet_name:指定保存到excel文件中的哪张工作表,且可命名工作表名称;
index:是否保存行索引,默认为True,因为excel中会自动生成行索引,该列可设置为False;
写在最后
希望以上的内容能对你有所帮助,后续我们也将持续推出实用干货,感谢点赞和关注。
欢迎关注我的专栏: