目标:读取excel中的长表,将其透视为短表
一张长表转换成宽表,使用函数pivot
前提:查看原数据是否有列名,如果原数据是左图这样
生成dataframe二维数据时会把第一行数据默认为索引(如右图),造成第一行数据丢失。因此在遇到这种数据时考虑在excel表中首行添加一行数据。具体代码为:
import pandas as pd
import openpyxl
path=r'C:\Users\Admin\Desktop\长表.xlsx'
wb=openpyxl.load_workbook(path)
sheet=wb['Sheet1']
sheet.insert_rows(0)#在0行之前插入一行,因为dataframe会把第一行变成索引
wb.save(path)
data1=pd.read_excel(path)
df=pd.DataFrame(data1,index=None)
df.columns=['列1','列2','列3']
pivoted=df.pivot('列1','列2','列3')
pivoted
pivoted.to_excel(r'C:\Users\Admin\Desktop\宽表.xlsx')
拓展:将宽表透视为长表的操作为melt,此时的宽表为
具体代码为:
import pandas as pd
import openpyxl
path=r'C:\Users\Admin\Desktop\宽表.xlsx'
data1=pd.read_excel(path)
df=pd.DataFrame(data1,index=None)
melted=pd.melt(df,['列1'])
melted.to_excel(r'C:\Users\Admin\Desktop\长表.xlsx')