一 excel数据透视表非常好用,如何使用pandas pivot完成类似任务,公司正好需要用到此功能,mark下.
首先看任务:
1.原始数据格式,有很多行,几万行都有可能:
2.目标完成的数据格式:
二。python实现代码:
import pandas as pd
import numpy as np
#方便看所有列名
pd.set_option('display.max_columns',None)
#从excel读取数据文件
df = pd.read_excel(r"D:\E0080855\cfReport\qcreport\store\ng_glass\ng_glass20190327172257.xlsx")
#pivot完成数据表透视功能,aggfunc表示计算个数,也可以使用np.sum np.mean等统计手法
#index 行使用step id, column列名使用product name, value使用计数
df1=pd.pivot_table(df,index=[u'STEP_NAME'],columns=['PRODUCT_NAME'],values=['GLASS_ID'],aggfunc='count')
#获取列名
columns_name = [x[1] for x in df1]
# print(columns_name)
#
#
# #获取每行数据,并转换为list
# print(df1.index.tolist())
#
#
# values_list = [x.tolist() for x in df1.values]
# print(values_list)
#
#
# print(df1.values[1])
values_dict={}
values_dict['item']=columns_name
temp = 0
for item in df1.index:
values_dict[item]=df1.values[temp].tolist()
temp+=1
for k,v in values_dict.items():
print(k,v)
运行结果: