一个excel文件中,有多个sheet,现在需要合并成一个文件。
- 需要按列合并成。
- 由于每个sheet中的列名称一样,合并后,需要重新命名。
- 每个sheet中的id是有一样的,读入文件的时候,就需要指定两个字段为索引,这样避免
sales = pd.read_excel('data/百店新老顾客占比-明细.xlsx' , sheet_name=None, index_col=[0,1] )
sales_concat = pd.concat( sales, axis=1 ).reset_index()
def mult_columns(df):
tmp=[]
for i in df.columns.ravel():
if i[1] == '':
tmp.append(i[0])
else:
tmp.append( "_".join(i) )
return tmp
sales_concat.columns = mult_columns(sales_concat)